Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей
Исследователи факультета компьютерных наук НИУ ВШЭ улучшили метод обучения генеративных потоковых нейросетей для работы с неструктурированными задачами. Это поможет искать новые лекарства эффективнее. Результаты работы были представлены на одной из ведущих конференций по машинному обучению — ICLR 2025. Текст работы доступен в репозитории Arxiv.org.
Генеративные потоковые сети (GFlowNets) — особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем.
Чтобы GFlowNets находили такие сложные структуры, исследователи объясняют им свойства объекта, который они хотели бы получить. Чем ближе решение нейросети по свойствам к заданным, тем более высокую награду она получит. Сеть стремится решить задачу так, чтобы получить максимальный приз. На данные она не обращает внимание, только на вознаграждение. Оно вычисляется через уравнение, которое называют функцией вознаграждения.
Процесс поиска сложного объекта можно сравнить со сборкой модели из блоков Lego. Вы последовательно добавляете детали, пока не получится что-то цельное, при этом у каждого объекта есть своя заданная ценность. Собранная модель растения, например, может оцениваться дороже модели животного. В отличие от других методов машинного обучения, которые будут стремиться любой ценой получить растение, GFlowNets будут собирать много разных объектов, но растения чаще, чем животных: так выгоднее.
При таком типе поиска GFlowNets используют две вероятностные модели, которые работают в паре: прямую и обратную. Прямая модель — прораб-строитель, который решает, куда идти дальше, и предсказывает вероятность последующего состояния, а обратная модель — эксперт-разборщик, который определяет, каким был предыдущий шаг. Важно, чтобы эти потоки были сбалансированы, но сделать это очень сложно. Во-первых, требуются большие вычислительные мощности, во-вторых, обратная модель не обладает достаточной гибкостью: обычно исследователи запрещают ей меняться в процессе поиска и подсматривать за действиями прямой.
Ученые НИУ ВШЭ нашли способ оптимизировать обратную модель с помощью метода Trajectory Likelihood Maximization (TLM). Они доработали алгоритмы обратной модели таким образом, чтобы она могла постоянно сверяться с действиями прямой модели.
Тимофей Грицаев
«Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и наконец смогли его получить», — поясняет один из авторов работы, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев.
После внедрения TLM функция вознаграждения, описывающая успешность решения задачи для обратной модели, стала сложнее. Однако, несмотря на увеличение сложности, вся система поиска стала быстрее и эффективнее.
Никита Морозов
«Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением», — говорит Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.
Авторы исследования уверены, что их работа поможет специалистам, применяющим GFlowNets в различных областях, таких как поиск новых лекарственных соединений, разработка материалов с заданными свойствами, а также тонкая настройка крупных языковых моделей. Благодаря способности таких сетей эффективно исследовать огромное пространство решений и быстро находить наиболее оптимальные варианты можно заметно сократить нагрузку на вычислительные мощности.
Грицаев Тимофей Григорьевич
Вам также может быть интересно:
Вышка и «Авито» запускают магистратуру по машинному обучению в цифровом продукте
Факультет компьютерных наук ВШЭ совместно с российской ИТ-компанией «Авито» объявляет о запуске новой магистерской программы по машинному обучению (ML) в цифровом продукте. Программа направлена на подготовку специалистов, которые смогут применять передовые технологии машинного обучения для решения реальных бизнес-задач и создания продуктов, используемых миллионами пользователей. Всего пройти обучение в первой волне смогут 35 человек, обучение 30 из них целиком профинансирует «Авито».
Анализ генетической информации поможет избежать осложнений после инфаркта
Исследователи из НИУ ВШЭ разработали модель машинного обучения, которая предсказывает риск развития осложнений у пациентов, перенесших инфаркт миокарда. В модели впервые учли генетические данные, что позволило точнее оценить риск долгосрочных осложнений. Исследование опубликовано в журнале Frontiers in Medicine.
Fall into ML 2024: взгляд в будущее машинного обучения
25–26 октября в Москве состоялась конференция Fall into ML, организованная Институтом искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ совместно с Центром ИИ при поддержке титульного партнера — Сбера. На протяжении двух дней ведущие специалисты в области искусственного интеллекта обсуждали перспективы развития фундаментальных технологий ИИ.
«Наша система позволяет предотвращать сбои в работе центров обработки данных»
Студент первого курса магистерской программы «Продуктовый подход и аналитика данных в HR-менеджменте» Константин Балцат с командой единомышленников разработали систему прогнозирования отказов жестких дисков на основе машинного обучения. С этим проектом они второй год подряд входят в число лучших на хакатоне «Цифровой прорыв». «Вышка.Главное» побеседовала с Константином о разработках инноваций и учебе в университете.
НИУ ВШЭ и ПСБ провели хакатон по ИИ для студентов ведущих вузов страны
В конце сентября онлайн-кампус НИУ ВШЭ и ПСБ организовали хакатон для студентов, которые увлекаются анализом данных, визуализацией и машинным обучением, а также студентов креативных индустрий. На хакатон зарегистрировалось 620 человек, приняло участие 428 человек из разных регионов РФ. За первое место боролись студенты лучших российских университетов, а также учащиеся из других государств. Победителями турнира стала команда из Вышки.
«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.
Школа по ML в биоинформатике: «отличная возможность для нетворкинга и изучения нового материала»
Факультет компьютерных наук НИУ ВШЭ провел ежегодную летнюю школу по машинному обучению в биоинформатике, слушателями которой стали более 300 человек из разных университетов, институтов и организаций. Всего на событие зарегистрировались более 800 человек. Трехдневная программа включала в себя лекции и семинары.
Ученые НИУ ВШЭ показали эффективность машинного обучения при прогнозировании инфляции
Инфляция — один из ключевых показателей экономической стабильности, и точное прогнозирование ее уровня в различных регионах имеет большое значение для государства, бизнеса и домохозяйств. Татьяна Букина и Дмитрий Кашин из НИУ ВШЭ в Перми выяснили, что машинное обучение для прогнозирования инфляции превосходит классические эконометрические модели в долгосрочных прогнозах. Исследование проводилось на примере субъектов Приволжья. Результаты опубликованы в журнале HSE Economic Journal.
Ученые НИУ ВШЭ предложили модель, лучше других определяющую тематику текстов
Тематические модели — алгоритмы машинного обучения, способные сортировать большие объемы текстов по темам. Исследователи из НИУ ВШЭ в Санкт-Петербурге сравнили пять тематических моделей и определили, какие из них работают лучше. Наименьшее число ошибок показали две модели, одна из которых, GLDAW, — разработка Лаборатории социальной и когнитивной информатики НИУ ВШЭ в Санкт-Петербурге. Статья опубликована в журнале PeerJ Computer Science.
«Цель школы Spring into ML — объединить молодых ученых, занимающихся математикой ИИ»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Университет Иннополис провели для студентов, аспирантов и молодых ученых недельную школу, посвященную применению математики в машинном обучении и искусственном интеллекте. 50 участников Spring into ML прослушали 24 доклада о машинном обучении, участвовали в тематических питч-сессиях и прошли два мини-курса по диффузионным моделям — развивающейся области ИИ для генерации данных.