Компанії, що працюють із штучним інтелектом, почали залучати акторів імпровізації для навчання моделей розпізнавати людські емоції та тон розмови. Вакансії пропонує платформа Handshake AI, яка постачає навчальні дані для провідних лабораторій ШІ. Учасники імпровізуватимуть сцени онлайн та допомагатимуть моделям відтворювати природну людську комунікацію, повідомляє The Verge.
Згідно з описом вакансії, учасники братимуть участь у платному імпровізаційному проєкті для “однієї з провідних компаній зі штучного інтелекту”. Вони працюватимуть у відеодзвінках з іншими виконавцями, де отримуватимуть короткі підказки або ситуації для спільної імпровізації.
Основною вимогою до кандидатів є досвід у театральній або імпровізаційній діяльності. Крім цього, у вакансії підкреслюється необхідність “емоційної обізнаності”, зокрема “здатності розпізнавати, виражати та переходити від однієї емоції до іншої так, щоб це виглядало природно та по-людськи”.
Такі дані потрібні для вдосконалення великих мовних моделей, які часто демонструють нерівномірні результати. Вони можуть успішно виконувати складні завдання, але водночас помилятися у простих речах, тому розробники намагаються заповнити прогалини за допомогою вузькоспеціалізованих наборів даних.
У вакансії зазначено, що імпровізаційні сесії будуть відкритими та не матимуть жорсткого сценарію. Учасники будуть “імпровізувати сцени, розкривати персонажів і природно реагувати в конкретній ситуації, маючи достатньо творчої свободи для того, щоб формувати хід кожної взаємодії”.
Роль передбачає часткову зайнятість із гнучким графіком та середньою оплатою близько 74 доларів за годину. Водночас журналісти The Verge раніше повідомляли, що в подібних проєктах початкові ставки часто знижуються після приєднання виконавців, а кількість доступних завдань може бути обмеженою.
Обговорення вакансії активно відбувається у спільноті r/improv на Reddit, де здебільшого її сприйняли як “антиутопічну” спробу ШІ привласнити людську щирість. Поки одні користувачі іронізують щодо втрати “прибуткових” місць у комедії, інші закликають саботувати навчання моделей. Проте багато хто вірить, що цифровізація лише збільшить попит на “живий”, неідеальний гумор, який комп’ютер не здатен відтворити.
Зростання попиту на подібні дані пов’язане з розвитком мультимодальних моделей. Такі системи здатні не лише генерувати текст, зображення або відео, а й спілкуватися з користувачами голосом із реалістичними інтонаціями.
Минулого року компанія OpenAI розширила голосовий режим ChatGPT, додавши кілька нових функцій та варіантів голосів для спілкування. Подібні функції також тестують інші розробники, зокрема xAI у чат-боті Grok та Anthropic у системі Claude.
