Российские ученые научили рекомендательные системы глубже понимать пользователей
11:30 16.04.2026 Источник: Информационное агентство России "ТАСС"
Учёные Центра практического искусственного интеллекта Сбербанка вместе с исследователями Института AIRI, Университета Иннополис и ИТМО нашли способ переносить глубокие семантические знания из больших языковых моделей в компактные рекомендательные системы. Для пользователя это повышает точность подбора товаров, фильмов и другого контента и при этом не замедляет работу сервисов — скорость выдачи рекомендаций остаётся на уровне исходной лёгкой модели. Свои результаты исследователи опубликовали в научной статье, подготовленной под руководством Алексея Васильева — исполнительного директора по исследованию данных Центра практического искусственного интеллекта Сбербанка. Работа объединённой команды исследователей была представлена на престижной конференции ECIR 2026.
Задача рекомендательных систем на последовательностях заключается в том, что они хорошо улавливают временные цепочки действий пользователя, но хуже понимают его истинные предпочтения, особенно если данных о человеке мало. Большие языковые модели умеют восстанавливать эти скрытые смыслы, но использовать их напрямую в реальных сервисах ресурсозатратно: один запрос к LLM может длиться более 10 минут. Подход российских ученых решает эту задачу. На этапе обучения модели по истории взаимодействий и текстовым метаданным формируется профиль пользователя — его предпочтения и особенности поведения. Затем он превращается в вектор, с которым выравниваются внутренние представления самой рекомендательной модели. В итоге, когда система выдаёт рекомендации реальному человеку (на этапе инференса), ресурсоёмкая модель уже не требуется.
Проверка на четырёх наборах данных показала: добавление LLM-дистилляции к популярным моделям SASRec и BERT4Rec даёт устойчивый прирост качества. На датасете ML-20M точность NDCG@10 выросла на 5,62%, а полнота Recall@10 — на 4,74% по сравнению с обычным SASRec. При этом скорость создания рекомендаций оказалась в 190 раз выше (4,37 секунды против 840 секунд) по сравнению с базовым методом IDGenRec на основе больших языковых моделей.
«Большие языковые модели обладают колоссальным объёмом знаний о мире и о том, как люди формулируют свои предпочтения, – отметил Николай Тиден, директор Центра практического искусственного интеллекта Сбербанка. – Но использовать их напрямую в рекомендательных сервисах — всё равно что приглашать профессора лингвистики для ответа на каждый вопрос в чате. Наш подход берёт у "профессора" самое ценное — понимание глубинных мотивов пользователя — и передаёт это быстрому и лёгкому "ассистенту". В итоге человек получает более точные рекомендации без задержек, а бизнес — масштабируемое решение без лишних расходов на инференс».
Использование решения позволит цифровым сервисам еще лучше понимать предпочтения пользователя. Кинотеатр подберёт фильм, который действительно понравится, интернет-магазин покажет нужный товар, даже если клиент ещё сам не сформулировал запрос. Компании же получают готовый метод повышать качество рекомендаций без роста вычислительных затрат, перестройки архитектуры и необходимости держать в продакшене тяжёлую большую языковую модель. Это особенно важно для крупных промышленных систем, где важна каждая миллисекунда.
Комментарии отключены - материал старше 3 дней
Новости
- 23:10 23.04.2026
- Мужчина совершил нападение на врачей в больнице в Махачкале
- 21:45 23.04.2026
- Сожжение флага Турции в центре Еревана Пашинян считает безответственным и недопустимым
- 20:15 23.04.2026
- Премьер Бельгии: Экономические последствия войны США с Ираном очень велики, особенно для нас
- 19:30 23.04.2026
- Европа с 2027 вводит запрет на использование СПГ-терминалов российскими компаниями
- 19:16 23.04.2026
- Целевой набор в вузы соотнесут с кадровой потребностью
- 18:45 23.04.2026
- Еврокомиссар по обороне обещает Киеву «больше дронов, боеприпасов и ракет»
- 18:25 23.04.2026
- Песков прокомментировал информацию о военных учениях Польши и Франции
- 17:40 23.04.2026
- Общее число танкеров в черном списке ЕС достигло 632
- 17:12 23.04.2026
- Сбои в работе интернета в РФ связаны с предотвращением угроз терроризма — Путин
- 17:00 23.04.2026
- Часть угольных компаний в РФ могут поглотить или ликвидировать из-за кризиса - министр энергетики РФ


комментарии(0)