ИИ-компании хотят использовать навыки актеров, чтобы научить нейросети человеческим эмоциям
Для работы требуется «способность распознавать, выражать и переключаться между эмоциями так, чтобы это выглядело естественно и по-человечески».
Если у вас сильное творческое чутье, вы умеете достоверно передавать эмоции и способны не выходить из образа на протяжении всей сцены, то на рынке появилась вакансия, где нужен именно ваш опыт.
Но есть нюанс: вам не придется выступать в театре, на киностудии или на андеграундной площадке. Вы будете использовать свои таланты для обучения модели искусственного интеллекта для «одной из ведущих ИИ-компаний». Об этом говорится в описании вакансии, опубликованной Handshake — компанией, которая поставляет обучающие данные для OpenAI и других лабораторий.
Handshake AI — одна из немногих компаний в своей нише, которые изо всех сил стараются предоставлять ИИ-разработчикам всё больше узкоспециализированных данных для «кормежки» нейросетей. ИИ-модели часто называют «неровными» (jagged): это означает, что они могут блестяще справляться с удивительно сложными задачами, но при этом с треском проваливаются на самых простых. ИИ-компании пытаются закрыть эти пробелы в знаниях с помощью специализированной разметки данных. В ответ на этот запрос такие подрядчики, как Handshake, Mercor и Scale AI, начали массово нанимать профессионалов из самых разных отраслей.
Как сообщало издание The Verge в декабре, прошлым летом спрос на обучающие данные у Handshake утроился, а в ноябре прогнозируемая годовая выручка компании превысила 150 миллионов долларов, пока та пыталась угнаться за потребностями рынка. Handshake и ее конкуренты активно хвастаются своими сетями, состоящими из десятков тысяч «белых воротничков» — от химиков и врачей до юристов и сценаристов. Многие из этих специалистов всерьез опасаются, что, обучая ИИ-модели, они собственными руками делают свои профессии ненужными гораздо быстрее, чем это произошло бы естественным путем.
И вот теперь ведущие ИИ-лаборатории добрались до комиков, актеров импровизации и театралов.
— Handshake AI приглашает актеров, импровизаторов и перформеров присоединиться к оплачиваемому совместному проекту по импровизации для работы с одной из ведущих ИИ-компаний, — говорится в описании вакансии. Участникам обещают, что их «соединят с другими исполнителями по видеосвязи и дадут легкую затравку или сценарий для совместного отыгрыша».
Вакансия рассчитана на людей с опытом работы в кино, комедии положений, скетчах или любом театральном искусстве. В тексте неоднократно и старательно подчеркивается, что компании нужны люди, способные, по сути, «проверить границы понимания ведущих мировых LLM (больших языковых моделей)», научив их распознавать или копировать человеческие интонации и эмоции. Одним из требований, например, является «эмоциональная осознанность» — в частности, «способность распознавать, выражать и переключаться между эмоциями так, чтобы это выглядело естественно и по-человечески». В описании также упоминается необходимость создавать «взаимодействия, которые ощущаются приземленными, человечными и в которые интересно играть».
В Handshake отказались от комментариев, а в самой вакансии не уточняется, для чего именно будут использоваться собранные данные.
В последние годы ИИ-компании сделали полноценную ставку на «мультимодальные» модели, которые могут не только генерировать изображения и видео, но и общаться с пользователями голосом, используя реалистичные интонации. После того как OpenAI впервые протестировала голосовой режим ChatGPT, в 2024 году компания пошла еще дальше, выпустив продвинутую (Advanced) версию с набором различных голосов на выбор. Компания Илона Маска xAI предлагает голосовой чат в своем ИИ Grok. А нейросеть Claude от Anthropic запустила голосовую функцию (по крайней мере, в бета-версии) еще в мае прошлого года.
Далее в описании вакансии Handshake говорится, что сессии проходят «без сценария и не имеют жестких рамок». Участники будут «импровизировать в сценах, раскрывать персонажей и естественно реагировать в моменте, имея полную творческую свободу в том, как будет развиваться каждое взаимодействие». Соискателям обещают частичную занятость и гибкие задачи, которые «легко совмещать с прослушиваниями, учебой или репетициями», при средней оплате в 74 доллара в час.
Однако, как недавно писало The Verge, первоначальная ставка в таких проектах часто стремительно падает после регистрации участника. А хваленый гибкий график оказывается не таким уж гибким, когда фрилансерам приходится конкурировать за ограниченное число новых задач, которые могут появиться — или исчезнуть — в любой момент.
Участники сообщества r/improv на платформе Reddit подробно обсудили вакансию от Handshake AI, причем некоторые назвали ее «антиутопичной». Один из пользователей написал: «Совершенно ясно, что это просто попытка заставить людей обучать ИИ-модели для создания видеороликов с помощью нейросетей». Другой отметил: «Думаю, они пытаются научить ИИ человеческому общению, а не тому, как быть импровизатором. Мой личный план — саботировать ввод данных». Третий горько пошутил: «Ну вот, теперь ИИ добрался и до наших «сверхприбыльных» должностей в комедийной импровизации».
Еще один комментатор подытожил: «Я предсказываю возрождение живой комедии. Люди устанут от онлайн-сервисов и захотят немного шероховатых, настоящих развлечений лицом к лицу. Думаю, это может стать отличным маркетинговым ходом для команд импровизаторов: «Приходите посмотреть на настоящую, неидеальную, смешную до слез комедию, созданную НЕ компьютером»».
Пояснения:
- «Зубчатые» модели (jagged) — термин «jagged intelligence» или «jagged AI» стал широко использоваться после исследования Гарвардской школы бизнеса (2023), описывающего неровный профиль способностей ИИ: модель может блестяще решать одни задачи и проваливаться на других, казалось бы, более простых. Это ключевая проблема современных больших языковых моделей.
- Handshake AI, Mercor, Scale AI — это компании-посредники в индустрии подготовки данных (data labeling / data training). Они нанимают людей-экспертов из различных профессиональных областей для создания, проверки и разметки данных, на которых обучаются ИИ-модели. По сути, они выступают «мостом» между человеческой экспертизой и машинным обучением.
- Run rate (годовая выручка в пересчёте) — финансовый термин, обозначающий экстраполяцию текущих доходов на годовой период. Когда говорят, что компания «преодолела 150 миллионов долларов run rate», это означает, что при текущих темпах её годовая выручка составила бы эту сумму.
- Мультимодальные модели — ИИ-модели, способные работать одновременно с несколькими типами данных: текстом, изображениями, аудио, видео. Переход к мультимодальности — одна из ключевых тенденций в развитии ИИ с 2023–2024 годов.
- Этическая проблема — это важная этическая дилемма современной ИИ-индустрии: профессионалов нанимают для обучения систем, которые потенциально могут заменить именно этих профессионалов. Это особенно болезненная тема для творческих работников — актёров, сценаристов, художников, — чьи навыки используются для создания генеративных моделей.
- r/improv — субреддит (тематическое сообщество на платформе Reddit), посвящённый импровизационной комедии и театру. Реакция его участников отражает более широкое недовольство и тревогу творческого сообщества перед лицом экспансии ИИ в сферу искусства.
- «Сверхприбыльные рабочие места» — ирония здесь в том, что импровизационная комедия традиционно считается одной из наименее оплачиваемых сфер актёрской деятельности — большинство импровизаторов не зарабатывают на этом существенных денег, что делает ситуацию особенно гротескной.