Ученые исследовательской лаборатории искусственного интеллекта (ИИ) Тинькофф Research создали самый эффективный среди мировых аналогов алгоритм обучения и адаптации искусственного интеллекта. Об этом CNews сообщили представители Tinkoff Research.

Новый метод, получивший название ReBRAC (Revisited Behavior Regularized Actor Critic), обучает ИИ в четыре раза быстрее и на 40% лучше, чем его мировые аналоги в области обучения с подкреплением (Обучение с подкреплениемР.Л.), адаптируя его к новым условиям в движении.

Разработки российских учёных в области повышения эффективности алгоритмов обучения ИИ могут помочь преодолеть технологические проблемы и Числовая дробь в мире между разными странами более эффективные алгоритмы требуют меньше вычислительных ресурсов. Страны с ограниченными вычислительными мощностями смогут создавать и развивать передовые технологии, адаптировать ИИ под конкретные прикладные задачи, тем самым существенно экономя на дорогостоящих экспериментах с ИИ.

Результаты исследования были признаны мировым научным сообществом и представлены на ведущей научной конференции в области искусственного интеллекта в мире — международной конференции по машинному обучению и нейроинформатике NeurIPS (The Conference and Workshop on Neural Information Processing Systems). В этом году конференция состоялась в 37-й раз – в Жители Нового Орлеана, СОЕДИНЕННЫЕ ШТАТЫс 10 по 16 декабря.

Ученые из Поиск Тинькофф выделил четыре компонента, которые присутствовали в алгоритмах в последние годы, но считались второстепенными и не подвергались детальному анализу:

Глубина нейронных сетей. Увеличение глубины сети помогает ей лучше понимать сложные закономерности в данных.

Регуляризация и критика действующих лиц. Агенты ИИ состоят из двух компонентов: «актера», который предпринимает действия, и «критика», который оценивает эти действия. Ученые использовали совместную регуляризацию двух компонентов, чтобы актор избегал нежелательных действий, а критик более эффективно их оценивал. Ранее было неясно, как наиболее эффективно объединить два подхода.

ЧИТАТЬ   Выпуск iPhone 15 оказался под угрозой

Увеличение эффективного горизонта планирования позволяет модели сбалансировать краткосрочные и долгосрочные аспекты проблемы и улучшает ее способность принимать решения.

Использование нормализации слоев (LayerNorm) — стабилизирует процесс обучения. нейронные сети

Ученые Тинькофф Исследования интегрировали эти компоненты в алгоритм Behavior Regularized Actor Critic (BRAC) 2019 года и провели исследование, поочередно варьируя каждый из них. Оказывается, правильное сочетание этих компонентов дает даже этому старому подходу высочайшую производительность среди лучших сегодняшних аналогов. Модифицированный алгоритм называется ReBRAC.

Тесты на робототехнических симуляторах показали, что алгоритм обучает ИИ в четыре раза быстрее и на 40% лучше всех существующих алгоритмов в оффлайн-тестах. Раньше лидерство принадлежало алгоритму САК-РНДтакже создан учеными Tinkoff Research.

Визуализация варианты тестирования алгоритма: поиск цели в лабиринте (Муравей), скорость бега (Полугепард, Хоппер, Walker2d), задания для роботизированных рук — правильно держать ручку (Ручка), открыть дверь, толкнуть гвоздь, переместить объект

ReBRAC также наиболее эффективно решает проблему вторичной переработки. искусственный интеллект, который обычно медленно адаптируется к новым условиям. Например, робот, который изначально был обучен передвигаться по траве, упадет, если двинется по льду. ReBRAC позволяет ИИ лучше учиться на лету и адаптироваться.

В 2023 году оценщики международная конференция по машинному обучению и нейроинформатика НейроИПС (Конференция и мастерская о нейронных системах обработки информации), в котором представлены открытия ученых из Поиск Тинькофф, поступило более 13 000 статей, представленных на рецензирование учёными всего мира, из которых 3500 были отобраны для презентации на конференции. Селективность составляет всего 26%. Среди них четыре научных статьи Тинькофф Исследовать. Помимо алгоритма ReBRAC, ученые представили две открытые библиотеки в области автономного обучения с подкреплением (Offline RL, ORL), благодаря которым специалистам по искусственному интеллекту больше не нужно самостоятельно воспроизводить результаты важнейших научных работ. На статьи уже цитируют ведущие исследовательские лаборатории мира, в том числе Стэнфордский университет, Калифорнийский университет, Беркли и исследовательская лаборатория Google DeepMind.

ЧИТАТЬ   В России закуплены сотни исключительно мощных ноутбуков для общеобразовательных школ

***

Тинькофф Research — один из немногих Русский преданные своему делу исследовательские группы Научное исследование внутри компании, а не на базе некоммерческой организации. Ученые Тинькофф Research исследуют наиболее перспективные направления искусственного интеллекта: обработку естественного языка (НЛП), компьютерное зрение (CV), обучение с подкреплением (RL) и системы рекомендаций (Сисрек). По результатам экспериментов пишут научные статьи для самых известных научных конференций: NeurIPS, ICML, Список контроля доступа, ЦВПР и другие. За два года существования команды было принято 20 докладов на крупных конференциях и семинарах в области ИИ. Цитируется научная работа Тинькофф Исследования ученые из университетов Беркли и Стэнфорда также исследовательский проект Google для изучения искусственного интеллекта Гугл ДипМайнд. Коллектив руководит исследовательской лабораторией»Тинькофф» на базах МФТИ и помогает талантливым студентам совершать научные открытия.

Source

От admin