Появление революционной нейросети ChatGPT стало крупнейшим событием в сфере ИИ в 2023 г. IT-специалисты всего мира задаются вопросом, почему искусственный интеллект вдруг начал выдавать результаты, которых от него никто не ожидал, и когда произошел скачок от количества к качеству. Что это за технология и почему необходимо срочно создавать российскую альтернативу, обсудили представители бизнеса и научного сообщества на конференции Data Fusion 2023, организованной CNews и ВТБ на площадке Сколтеха в Москве.

Парадокс Чжуан-цзы

Появление технологии OpenAI ChatGPT произвело эффект разорвавшейся бомбы — как в экспертном сообществе, так и в массовом сознании. Начал дискуссию с хорошей метафоры Денис Суржко, Начальник отдела передовых алгоритмов машинного обучения в Департаменте анализа данных и моделирования банка ВТБ. Это относится ко сну китайского философа Чжуан-Цзы, который сказал, что не может понять, снилось ли ему, что он бабочка, или бабочке, которой снится, что она философ.

«Когда мы тестировали ChatGPT, нам было интересно, когда же появится такая нейросеть, которая окажется человеком. Или это будет человек, который думает, что он нейросеть? — продолжил он. — Очевидно, что революция произошла через синергетический эффект архитектуры трансформатора, который был известен давно, с обучением под руководством человека, он сыграл важную роль в развитии технологии НЛП в этой сети. Мы видим эффект слияния революции, умноженный на большой данные огромной выборки.

Однако участники дискуссии разделились на два лагеря. Некоторые называют технологию новаторской, поскольку она начала демонстрировать возможности, которые изначально в ней не предполагались. Другие говорят, что нынешний уровень достигнут эволюцией и что нейросеть кажется волшебной только неспециалисту.

«Несмотря на все проблески интеллекта, это все же имитация интеллекта….Люди, которые говорят, что это нечеловеческий разум, поддались эмоциям и когнитивным искажениям — это пройдет», — сказал профессор РАН. , заведующий лабораторией Института перспективных исследований искусственного интеллекта и интеллектуальных систем МГУ им. М.В. Ломоносова Константин Воронцов. По его словам, мыслительная способность ТШП, по-видимому, случайна». Но, тем не менее, «переход от количества к качеству произошел», — считает он.

ЧИТАТЬ   Почта Банк внедряет платформу «Сфера» для управления эффективностью сотрудников

более скептически Михаил Степновдиректор AdTech Big Data в МТС, который сказал, что ажиотаж и вау-эффект от ChatGPT вызвали только люди, которые профессионально не занимаются нейронными сетями.

«Также нужно понимать разницу между GPT-3.5, GPT-5 и ChatGPT. Первые две — это модели, а ChatGPT — это продукт. Разница в пользовательском интерфейсе, это стало понятно всем. как с Midjourney, после чего все разобрались, как использовать нейросеть», — отметил он. — В любом случае мы наблюдаем эволюционное развитие — из того, что я собрал из статей и обзоров, следует, что принципиально новая модель — это не отличается от предыдущих, разве что большим количеством данных и интерфейсом. Последний производил впечатление на людей, создавал нечто неотличимое от волшебства.

Андрей ЧервонныйТехнический директор «Вариант Софт» отметил, что технология не стала бы модной, если бы она не решала прикладные и бизнес-задачи прямо сейчас, а не только «игровые». «Вы можете писать живой код, создавать проекты, решать творческие задачи, раньше это было невозможно», — сказал он.

Директор Центра технологий искусственного интеллекта Сколтеха Иван Оселедец признался, что профессора Сколтеха уже советуют студентам использовать ChatGPT при написании дипломов, так как это определенно сделает текст на английском лучше. Но ответственность за содержание работы всегда лежит на самих студентах.

Как создается ChatGPT

Интересно, что специалисты по ИИ до сих пор точно не понимают, «из чего сделан» ChatGPT и что нужно сделать, чтобы создать аналог.

«Мы точно не знаем, как была создана технология», — говорит Александр Панченко, Старший научный сотрудник группы вычислительной семантики AIRI. — Мы знаем основные ингредиенты, имеем представление об архитектуре, слоях. Дело в том, что в процедуру внесены изменения — обучение по инструкции, включение обратной связи с человеком. Но всегда есть соус, которого мы не знаем».

Андрей Червонный посоветовал коллегам поинтересоваться у него, как создавался ChatGPT — он с удовольствием рассказывает о своих слоях гораздо больше, чем в документации. Другое дело, что технологии не могут перестать говорить и просто врать.

ЧИТАТЬ   Asus все еще находится на стадии обучения производству в Индии: Питер Чанг

«Также нужно понять, что такого нового в теории ИИ, что позволяет ChatGPT выйти на такой уровень — или это просто шаг в развитии железа и оптимизации ПО под него, просто появились более мощные суперкомпьютеры? Андрей Червонный задал вопрос.

Иван Оселедец отметил, что в обучающую выборку добавили от 10 до 100 тысяч диалогов, но секрет кроется в правильном сборе данных и их правильной подаче.

«Мы признаем это: инженеры обучили модель, и мы не можем объяснить, почему она работает именно так, а не иначе. Потому что она делает много интересных вещей, которые никак не объясняются математически. принципы обучения ИИ — может быть, даже простая идея, но она все равно кому-то пришла в голову, и качество нейросети возросло колоссально», — сказал Иван Оселедец.

Он отметил, что нейронная сеть вполне может стать будущим поисковых систем. По словам Ивана Оселедца, если подключить нейросеть к современной базе данных, она будет иметь доступ к актуальной информации, брать документы и интегрировать их. А пользователи получат ответы на свои вопросы в самой устраивающей их редакции. Поэтому Google следует присмотреться к инструментам искусственного интеллекта для улучшения поисковой системы.

7 критериев для «суверенного ChatGPT»»

Константин Воронцов выразил обеспокоенность тем, что текущая модель нейросети не может гарантировать, что она не дает ничего, кроме правды.

CNews, ВТБ и Сколково объявили победителей премии Data Fusion Awards

«Мы видим, что ТШП может вводить людей в заблуждение, ненароком заливать информационное поле лженаукой и ненормативной лексикой, что пропаганда может охватывать технологии», — сказал он. Поэтому, уверен ученый, возникает острая необходимость в создании «суверенной» ТШП — которая, видимо, должна быть до конца честной со своими пользователями и не опускаться до манипулирования общественным сознанием.

Воронцов даже привел семь критериев, которым должна соответствовать импортированная, этичная версия нейросети.

Участники дискуссии сразу обозначили как основные препятствия на пути развития такой технологии, так и потенциальные возможности.

Андрей Червонный заявил, что на обучение нейросети всем языкам народов России потребуется огромное количество времени, а Иван Оселедец заявил, что для этого, как минимум, должны быть организованы масштабные лингвистические экспедиции. . Он добавил, что для создания «ортодоксальной» версии ChatGPT с собственными информационными фильтрами потребуется работа филологов и философов, а не дата-инженеров и математиков.

ЧИТАТЬ   Microsoft стреляет себе в колено. Edge для Windows 11 введет новые ограничения, и пользователи будут скачивать Chrome еще чаще

Foresight Day 2023: импортозамещение продолжается

независимость от импорта

«Здесь мы переходим от цифр к высоким понятиям. Вот где золотая жила гуманитариев», — сказал он. И, если вернуться к технической стороне вопроса, из ChatGPT можно скопировать множество диалогов, выдаваемых закрытой версией, и начать на них тренировать свою модель, делать по его мнению, это «довольно просто».

Александр Панченко согласился с тем, что ChatGPT не должен оставаться проприетарной технологией, доступной лишь небольшому кругу компаний — и в академических кругах уже предпринимаются попытки воспроизвести их результаты путем обучения наборов данных на определенных открытых моделях. По его мнению, эти два потока — крупные проприетарные системы и открытые альтернативные реализации технологии — будут развиваться независимо друг от друга.

Однако некоторые российские аналоги модели GPT третьего поколения уже существуют: как отмечает Михаил Степнов, с ними даже удобнее работать, поскольку они построены на технологии с открытым исходным кодом, в отличие от закрытого ChatGPT. Это, например, mGPT от Сбербанка и ЯЛМ от Яндекса. Они более универсальны и могут быть настроены под конкретные бизнес-процессы компании.

Участники дискуссии пришли к выводу, что в целом в ближайшие несколько лет (познакомились на конференции, правда, более оптимистичные оценки — «от полугода до года») создание российского аналога ChatGPT вполне возможно. . Однако на пути к его созданию есть значительные трудности: пока у российских предприятий проблемы с мощностями, которые, увы, не закрывает параллельный импорт, и катастрофическая нехватка профильных специалистов.

Анжела Патракова

Source

От admin