Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

09.09.2025, 15:58, Разное
  Поддержать в Patreon

Внутреннее тестирование «Яндекса» показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на семь процентов по показателям качества ранжирования. «Яндекс» планирует использовать метод при обучении рекомендательных моделей собственных сервисов, в частности «Маркета». Метод будет полезен и другим компаниям, а также независимым разработчикам, работающим с рекомендательными системами в любой сфере — будь то соцсеть, интернет-магазин или стриминговый сервис.

О новом методе исследователи «Яндекса» рассказали в научной статье, которая была принята на ACM RecSys 2025. Это главная ежегодная международная конференция по рекомендательным системам, которая в этом году пройдет в девятнадцатый раз в Чехии. На конференцию также приняты работы крупнейших мировых технологических компаний — Amazon, Google и других.

Неточности при обучении рекомендательных систем

Рекомендательные системы обычно работают с миллионами объектов — текстами, аудио, видео, товарами. Это требует больших вычислительных ресурсов. Но сначала модель нужно обучить также на миллионах примеров, и для этого тоже необходимо много ресурсов. Чтобы сделать этот процесс менее ресурсоемким, во всем мире используют разные методы, которые заменяют сложные расчеты на более простые. Один из таких методов — sampled softmax, или алгоритм выборочного сэмплирования.

Его суть в том, что систему обучают различать предпочтения людей путем сравнения реализованных действий, которые пользователи совершили по отношению к конкретному объекту (положительные примеры), с нереализованными действиями, которых они не совершали относительно того же объекта (отрицательные примеры). В качестве объекта, например, может выступать определенный товар, тогда положительный пример — это добавление в корзину, а отрицательный — просмотр на сайте без добавления.

Обучение системы строится на том, что ей показывают положительный пример и отрицательные, — и благодаря этому модель начинает отличать одно от другого. Но можно показать ей миллионы отрицательных примеров из обучающего каталога, а можно лишь несколько случайно выбранных — в этом и заключается преимущество метода sampled softmax, которое позволяет экономить вычислительные ресурсы. Однако этот метод может привести к некачественному обучению из-за некорректного учета вероятностей — актуальна ли для пользователя рекомендация или нет. В результате модель будет давать неверные рекомендации.

Решение с помощью новой формулы

Для корректной работы метода требуется использовать обновленную формулу пересчета вероятностей того, что пользователь заинтересуется определенным товаром или контентом, — LogQ. Главная математическая трудность была в том, что существующие методы предполагают одинаковые правила отбора для всех примеров, а на практике положительные и отрицательные примеры попадают в данные по-разному. Из-за этого стандартные формулы начинают систематически искажать оценки, и требовалось специально скорректировать пересчет вероятностей, чтобы сделать модель объективнее.

«Яндекс» запустит беспилотное такси в «Сколково» Поначалу услуга будет доступна только резидентам инновационного центра, изъявившим желание поучаствовать в испытании беспилотника. naked-science.ru

Благодаря формуле модель при обучении начинает понимать, что реальные действия пользователя выбираются не случайным образом и явно задаются ей как положительные примеры, а остальные примеры — отрицательные и выбраны случайно. Это позволяет уменьшить смещения в оценках со стороны модели, то есть искажения, влияющие на точность ее финальных рекомендаций. В результате модель лучше понимает предпочтения пользователей и, как следствие, дает им более подходящие рекомендации.

Компании и разработчики могут использовать новую формулу при обучении любой рекомендательной системы. Для этого им не придется менять архитектуру своих моделей.

Смотреть комментарии → Комментариев нет


Добавить комментарий

Имя обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam

ПОСЛЕДНЕЕ

09.09 / Трамп заявил, что узнал о планах Израиля нанести удар в Дохе слишком поздно, чтобы вмешаться

09.09 / Дональд Трамп сообщил об освобождении израильтянки Елизаветы Цурковой, похищенной в Ираке

09.09 / Белый дом выразил недовольство атакой Израиля в Дохе, но не осудил ее

09.09 / Семьи заложников встретились в Вашингтоне с представителями Катара

09.09 / WSJ — США предупредили Катар о предстоящем ударе Израиля по лидерам ХАМАСа

09.09 / В Казани составили 124 административных протокола на людей, фотографировавших радугу после дождя

09.09 / Правительство Великобритании не считает, что Израиль совершает геноцид в Газе

09.09 / Посол Израиля в ООН — «Террористам нигде не спрятаться»

09.09 / После ликвидации лидеров ХАМАСа в Дохе полиция Нью-Йорка усилила меры безопасности

09.09 / В обмен на закупки газа Китай потребовал создать в РФ «настоящую» компартию. Её возглавит Малинкович

Политика конфиденциальности - GDPR

Карта сайта →

По вопросам информационного сотрудничества, размещения рекламы и публикации объявлений пишите на адрес: [email protected]

Поддержать проект:

PayPal - [email protected]; Payeer: P1124519143; WebMoney – Z399334682366, E296477880853, X100503068090

18+ © 2025 Такое кино: Самое интересное о культуре, технологиях, бизнесе и политике