
ИИ пока не отнимает вашу работу, но это может скоро случиться
26.09.2025, 17:35, Технологии
Теги: Безработица, Бизнес, Работа
Новый тест от OpenAI показывает: Claude и GPT-5 уже не уступают экспертам-людям в решении реальных рабочих задач. И самое тревожное: всего за 15 месяцев их производительность выросла на 300 процентов.
В четверг OpenAI представила GDPval — новый бенчмарк, который пытается качественно оценить, может ли ИИ выполнять вашу настоящую работу.
Речь не о гипотетических экзаменационных вопросах, а о реальных результатах труда: юридических заключениях, инженерных чертежах, планах ухода за больными, финансовых отчётах — о той самой работе, которая позволяет платить по счетам. Исследователи целенаправленно сосредоточились на профессиях, где не менее 60% задач выполняются на компьютере, — ролях, которые они описывают как «преимущественно цифровые».
В эту категорию входят профессиональные услуги (разработчики ПО, юристы, бухгалтеры, менеджеры проектов), финансовый и страховой секторы (аналитики, специалисты по обслуживанию клиентов), а также информационная сфера (от журналистов и редакторов до продюсеров и аудиовизуальных техников). Также в списке фигурируют административные должности в здравоохранении, «белые воротнички» в промышленности, менеджеры по продажам и недвижимости.
Внутри этой группы работа, наиболее подверженная влиянию ИИ, совпадает с теми видами цифровой, наукоёмкой деятельности, с которыми большие языковые модели уже хорошо справляются:
— Разработка программного обеспечения, представляющая собой крупнейший пул по уровню заработной платы в наборе данных, выделяется как особенно уязвимая сфера.
Юридическая и бухгалтерская работа, с её сильной зависимостью от документов и структурированных рассуждений, также находится в верхней части списка, как и финансовые аналитики и представители службы поддержки.
— Создатели контента — редакторы, журналисты и другие работники медиа — сталкиваются с аналогичным давлением, учитывая растущее мастерство ИИ в работе с языком и создании мультимедиа.
— Отсутствие в исследовании профессий, связанных с ручным и физическим трудом, подчёркивает его границы: GDPval не был предназначен для измерения рисков в таких областях, как строительство, техническое обслуживание или сельское хозяйство. Вместо этого он акцентирует внимание на том, что первая волна потрясений, скорее всего, ударит по «белым воротничкам» и офисным работникам — тем самым видам труда, которые когда-то считались наиболее защищёнными от автоматизации.
Американцы всё больше беспокоятся о проникновении искусственного интеллекта в их повседневную жизнь: половина из них теперь заявляет, что технология их скорее тревожит, чем воодушевляет. Это резкий скачок по сравнению с 37% всего четыре года назад, согласно новому опросу Pew Research Center. Исследование, в котором приняли участие 5 023 взрослых американца, было проведено в июне 2025 года и опубликовано на этой неделе. Оно выявляет нацию, столкнувшуюся с фундаментальным парадоксом: хотя 73% опрошенных готовы позволить ИИ помогать им в повседневных делах, 61% одновременно хотят большего контроля…
Этот отчёт развивает идеи двухлетнего исследования OpenAI и Университета Пенсильвании, в котором утверждалось, что до 80% работников в США могут столкнуться с влиянием ИИ как минимум на 10% своих задач, а около 19% работников — как минимум на 50%. Наибольшему риску (или трансформации) подвержены «белые воротнички» и наукоёмкие профессии — особенно в юриспруденции, писательстве, аналитике и взаимодействии с клиентами.
Но самое тревожное — это не сегодняшние цифры. Это динамика. Такими темпами, как показывают данные, к 2027 году ИИ сможет сравняться с экспертами-людьми во всех областях. Это очень близко к стандартам сильного искусственного интеллекта (AGI) и может означать, что даже задачи, которые считались небезопасными или слишком специализированными для автоматизации, скоро могут стать доступны машинам, угрожая стремительной трансформацией рабочих мест.
OpenAI протестировала 1 320 задач в 44 профессиях — и это не случайные работы, а роли в девяти секторах, которые обеспечивают большую часть ВВП Америки. Разработчики, юристы, медсёстры, финансовые аналитики, журналисты, инженеры: люди, которые думали, что диплом защитит их от автоматизации.
Каждая задача была предоставлена профессионалами со средним опытом работы 14 лет — не стажёрами или недавними выпускниками, а опытными экспертами, знающими своё дело. Задачи тоже были непростыми: в среднем на их выполнение уходило семь часов, а некоторые растягивались на несколько недель.
По данным OpenAI, модели выполняли эти задачи до 100 раз быстрее и значительно дешевле людей в некоторых специфических API-задачах, что, впрочем, ожидаемо и наблюдается уже десятилетиями. В более специализированных задачах улучшение было медленнее, но всё равно заметным.
Даже с учётом времени на проверку и периодические переделки, когда ИИ выдавал нечто странное, экономическая чаша весов всё равно склоняется в сторону автоматизации.
Но не вешайте нос: то, что работа подвержена влиянию ИИ, не означает, что она исчезнет. Она может быть дополнена (например, юристы и журналисты будут использовать нейросети для более быстрого написания текстов), а не полностью заменена.
И как бы далеко ни зашёл ИИ, галлюцинации по-прежнему остаются головной болью для бизнеса. Исследование показывает, что чаще всего ИИ ошибается в следовании инструкциям — 35% неудач GPT-5 были связаны с неполным пониманием задачи. Ещё 40% провалов пришлись на ошибки форматирования.
Модели также с трудом справлялись с задачами, требующими сотрудничества, взаимодействия с клиентами и подлинной ответственности, которые OpenAI не включила в исследование. Пока ещё никто не подаёт в суд на ИИ за профессиональную халатность. Но в сфере индивидуальной цифровой работы — отчётов, презентаций и аналитических записок, которыми заполнены дни большинства интеллектуальных работников, — разрыв сокращается стремительно.
Без срочного вмешательства мы рискуем создать антиутопическое будущее, управляемое невидимыми, автономными ИИ-экономиками, которые усугубят неравенство и системные риски. Таково суровое предупреждение исследователей из Google DeepMind в их новой статье «Экономики виртуальных агентов». В статье исследователи Ненад Томашев и Матия Франклин утверждают, что мы несёмся к созданию «песочной экономики». Этот новый экономический слой будет состоять из ИИ-агентов, совершающих сделки и координирующих действия на скоростях и в масштабах…
OpenAI признаёт, что сегодня GDPval охватывает лишь очень ограниченное число задач, которые люди выполняют в реальной жизни. Бенчмарк не может измерить навыки межличностного общения, физическое присутствие или тысячу микрорешений, которые делают человека ценным помимо результатов его работы.
И всё же, когда инвестиционные банки начинают сравнивать анализ конкурентов, сделанный ИИ, с анализом от живых аналитиков; когда больницы оценивают планы ухода за больными, составленные ИИ, в сравнении с планами опытных медсестёр; и когда юридические фирмы проверяют составленные ИИ иски в сравнении с работой младших юристов — это уже не домыслы. Это измерения.