Т-банк стал региональным партнером программы «Сириус. Лето: начни свой проект» в Свердловской области.
Компания давно сотрудничает с Сириусом в рамках флагманских конкурсов и программ, но на уровне региона сформулировал задачу впервые.
Эксперты технологической компании предложили школьникам дообучить модель T-Lite. Задача оказалась настолько интересна, что за нее взялись сразу две команды.
Представляем опыт одной из них – под наставничеством Анастасии Зенковой, педагога Фонда «Золотое сечение».
T-Lite — это языковая модель (тип ИИ, который обучается на огромных объёмах текстовых данных для понимания и генерации человеческого языка), ориентированная на решение узкоспециализированных задач в бизнесе. Она признана одной из лучших в мире открытых моделей на русском языке. Модели T-Lite, а также T-Pro превосходят все российские и зарубежные модели по общему уровню знаний, умению вести диалог и выполнять практические задачи.
Но даже такой продукт требует усовершенствования. Школьникам было необходимо повысить качество и надежность языковой модели T-Lite, снизив количество ошибок, «галлюцинаций» и неправильных ответов через процесс дообучения на специально собранных и отфильтрованных данных.
В состав команды Анастасии Зенковой вошли
- Павел Маслов, 10 класс, МАОУ СОШ №181,
- Александр Глазырин, 9 класс, МАОУ Лицей №173,
- Захар Волков, 10 класс, МАОУ Лицей №109,
- Алиса Кардашина, 10 класс, МАОУ СОШ №11,
- Богдан Тарасенко, 9 класс, МАОУ Гимназия №116, г. Екатеринбург.
Языковая модель включает в себя данные по самым разным темам, но по определённым направлениям может не обладать достаточной информацией. Целью команды было определить узкую тему, в которой слаба языковая модель. Ребята выбрали тему популярной компьютерной игры и на этом примере смогли продемонстрировать заказчику свои наработки и эффективность дообучения.
Ребята провели анализ существующих способов и методик дообучения больших языковых моделей, оценив их применимость к архитектуре T-Lite; сформировали перечень вопросов, тематик и сценариев, в которых базовая модель T-Lite демонстрирует наибольшее количество ошибок и искажений. Они разработали стратегию уменьшения «галлюцинаций», включающую подготовку эталонных ответов и выполнили цикл дообучения модели, внедрили исправления. Для решения задач было собрано 500 типовых запросов. В начале работы языковая модель выдавала 7% правильных ответов по ним, а после дообучения, проведенного командой, правильных ответов стало 15%. Это ощутимое улучшение работы.
Заказчик высоко оценил уровень компетенций школьников, их активность в поиске информации и погружении в тему проекта и планирует продолжать сотрудничество в рамках программы «Сириус. Лето».
Михаил Гашков, старший исследователь-разработчик АО «Т-банк», координатор проекта со стороны заказчика:
Михаил отмечает, что одно из самых важных в профессии ИТ будет оставаться любознательность, готовность разбираться в новом и lifetime learning – обучение на протяжении всей жизни.
А проект команды Анастасии Зенковой развивается. На выходе планируется получить улучшенную версию модели T-Lite. Параметры, к которым можно стремиться в будщем это статистически значимое снижение процента «галлюцинаций» в заданных областях; сохранение общей производительности и скорости инференса – процесса использования уже обученной модели ИИ для принятия решений на новых данных; улучшение качества ответов на смежные темы за счет косвенного влияния дообучения.
Таким образом, модель будет адаптирована для более надежной эксплуатации в бизнес-среде заказчика.

