Т-банк стал региональным партнером программы «Сириус. Лето: начни свой проект» в Свердловской области.

Компания давно сотрудничает с Сириусом в рамках флагманских конкурсов и программ, но на уровне региона сформулировал задачу впервые.

Эксперты технологической компании предложили школьникам дообучить модель T-Lite. Задача оказалась настолько интересна, что за нее взялись сразу две команды.

Представляем опыт одной из них – под наставничеством Анастасии Зенковой, педагога Фонда «Золотое сечение».

T-Lite — это языковая модель (тип ИИ, который обучается на огромных объёмах текстовых данных для понимания и генерации человеческого языка), ориентированная на решение узкоспециализированных задач в бизнесе. Она признана одной из лучших в мире открытых моделей на русском языке.  Модели T-Lite, а также T-Pro превосходят все российские и зарубежные модели по общему уровню знаний, умению вести диалог и выполнять практические задачи.

Но даже такой продукт требует усовершенствования. Школьникам было необходимо повысить качество и надежность языковой модели T-Lite, снизив количество ошибок, «галлюцинаций» и неправильных ответов через процесс дообучения на специально собранных и отфильтрованных данных.

В состав команды Анастасии Зенковой вошли

  • Павел Маслов, 10 класс, МАОУ СОШ №181,
  • Александр Глазырин, 9 класс, МАОУ Лицей №173,
  • Захар Волков, 10 класс, МАОУ Лицей №109,
  • Алиса Кардашина, 10 класс, МАОУ СОШ №11,
  • Богдан Тарасенко, 9 класс, МАОУ Гимназия №116, г. Екатеринбург.

Языковая модель включает в себя данные по самым разным темам, но по определённым направлениям может не обладать достаточной информацией. Целью команды было определить узкую тему, в которой слаба языковая модель. Ребята выбрали тему популярной компьютерной игры и на этом примере смогли продемонстрировать заказчику свои наработки и эффективность дообучения.

Ребята провели анализ существующих способов и методик дообучения больших языковых моделей, оценив их применимость к архитектуре T-Lite; сформировали перечень вопросов, тематик и сценариев, в которых базовая модель T-Lite демонстрирует наибольшее количество ошибок и искажений. Они разработали стратегию уменьшения «галлюцинаций», включающую подготовку эталонных ответов и выполнили цикл дообучения модели, внедрили исправления. Для решения задач было собрано 500 типовых запросов. В начале работы языковая модель выдавала 7% правильных ответов по ним, а после дообучения, проведенного командой, правильных ответов стало 15%. Это ощутимое улучшение работы.

Заказчик высоко оценил уровень компетенций школьников, их активность в поиске информации и погружении в тему проекта и планирует продолжать сотрудничество в рамках программы «Сириус. Лето».

Михаил Гашков, старший исследователь-разработчик АО «Т-банк», координатор проекта со стороны заказчика:

Поставленные задачи в этом по большей степени учебном проекте ребятам удалось решить: дообучить новую модель, а также оценить успешность этого обучения. Здесь главное, что ребята смогли попробовать себя в чем-то новом, лучше понять, чем занимается МЛ-инженер в рабочих задачах, и презентовать свои результаты

Михаил отмечает, что одно из самых важных в профессии ИТ будет оставаться любознательность, готовность разбираться в новом и lifetime learning – обучение на протяжении всей жизни.

А проект команды Анастасии Зенковой развивается. На выходе планируется получить улучшенную версию модели T-Lite. Параметры, к которым можно стремиться в будщем это статистически значимое снижение процента «галлюцинаций» в заданных областях; сохранение общей производительности и скорости инференса – процесса использования уже обученной модели ИИ для принятия решений на новых данных; улучшение качества ответов на смежные темы за счет косвенного влияния дообучения.

Таким образом, модель будет адаптирована для более надежной эксплуатации в бизнес-среде заказчика.