Сколько моделей ИИ слишком много? Это зависит от того, как вы на это смотрите, но 10 занятий в неделю — это, наверное, слишком много. Примерно столько моделей мы видели в последние дни, и становится все труднее сказать, сравниваются ли эти модели друг с другом и как, если это вообще возможно. Итак, для чего это нужно?

Мы переживаем странное время в эволюции ИИ, хотя, конечно, все это время оно было довольно странным. Мы наблюдаем распространение моделей, больших и малых, от нишевых разработчиков до крупных, хорошо финансируемых разработчиков.

Давайте пройдемся по списку на эту неделю, ладно? Я постарался кратко описать то, что отличает каждую модель.

  • ЛЛаМа-3: Последняя крупная «открытая» флагманская языковая модель Meta. (Термин «открытый» в настоящее время оспаривается, но этот проект, тем не менее, широко используется сообществом.)
  • Мистраль 8×22: довольно крупная модель «экспертного микса» из французского бренда, который боялся открытости, которую когда-то принимал.
  • Стабильная трансляция 3 Турбо: обновленный SD3 для работы с новым открытым API стабильности. Заимствовать слово «турбо» из номенклатуры моделей OpenAI немного странно, но это нормально.
  • Adobe Acrobat AI-помощник: «Поговорите со своими документами» от 800-фунтовой документальной гориллы. Я почти уверен, что это в основном обертка для ChatGPT, однако.
  • Сладкое ядро: созданная небольшой командой, ранее работавшей в Big AI, мультимодальная модель, созданная с нуля, которая, по крайней мере номинально, конкурентоспособна с большими собаками.
  • Идентификаторы2: более открытая мультимодальная модель, созданная на основе последних и меньших по размеру моделей от Mistral и Google.
  • ОЛМо-1,7-7Б: Увеличенная версия AI2 LLM, одна из самых открытых на рынке и трамплин к будущей модели масштаба 70B.
  • Свая-Т5: Версия старой надежной Т5 Модель уточнена в базе данных кода Pile. Тот же T5, который вы знаете и любите, но с более качественным кодированием.
  • Соедините компас: «модель интеграции» (если вы еще не знаете, не волнуйтесь), ориентированная на интеграцию нескольких типов данных для охвата большего количества вариантов использования.
  • Представьте себе вспышку: новейшая модель генерации изображений Meta, использующая новый метод дистилляции для ускорения доставки без слишком большого ущерба для качества.
  • Безлимитный: «Персонализированный ИИ, основанный на том, что вы видели, говорили или слышали. яЭто веб-приложение, приложение для Mac, приложение для Windows и портативное устройство. 😬
ЧИТАТЬ   Instagram недоступен для нескольких пользователей (обновление: он вернулся) | TechCrunch

Получается 11, как было объявлено, когда я писал это. И это далеко не все модели, выпущенные или анонсированные на этой неделе! Это только те, которые мы видели и обсуждали. Если немного смягчить условия включения, их будут десятки: доработанные существующие модели, комбо типа Idefics 2, экспериментальные или нишевые и т. д. Не забываем о новых строительных инструментах этой недели (поджог) и бороться против (Глазурь 2.0) Генеративный ИИ!

Что мы думаем об этой бесконечной лавине? Мы не можем «исследовать» их все. Так как же мы можем помочь вам, нашим читателям, понять и отслеживать все эти вещи?

Правда в том, что вам не нужно идти в ногу со временем. Некоторые модели, такие как ChatGPT и Gemini, превратились в целые веб-платформы, охватывающие множество вариантов использования и конечных точек. Другие основные языковые модели, такие как LLaMa или OLMo, хотя технически они имеют общую базовую архитектуру, на самом деле не выполняют ту же роль. Они должны жить на заднем плане как услуга или компонент, а не на переднем плане как бренд.

Между этими двумя вещами происходит намеренная путаница, потому что разработчики моделей хотят позаимствовать некоторую помпезность, связанную с основными выпусками платформ искусственного интеллекта, такими как GPT-4V или Gemini Ultra. Все хотят, чтобы вы думали, что их освобождение важно. И хотя для кого-то это, вероятно, важно, этот человек определенно не вы.

Подумайте об этом в смысле другой большой и разнообразной категории, такой как автомобили. Когда их изобрели, вы просто купили «машину». Затем, немного позже, вы сможете выбирать между большой машиной, маленькой машиной и трактором. Сейчас каждый год выпускают сотни машин, но об одной из десяти вам, наверное, и не нужно знать, потому что девять из десяти – это не та машина, которая вам нужна, и даже не машина в том смысле, в каком вы ее слышите. Точно так же мы движемся от эпохи большого/маленького/тракторного ИИ к эпохе распространения, и даже специалисты по ИИ не могут успевать за каждой выпускаемой моделью и тестировать ее.

ЧИТАТЬ   Bugcrowd собирает 102 миллиона долларов на платформу безопасности Bug Bounty, которой пользуются более 500 000 хакеров | TechCrunch

Другая сторона этой истории заключается в том, что мы уже находились на этом этапе задолго до выпуска ChatGPT и других основных моделей. Гораздо меньше людей читало об этом 7 или 8 лет назад, но мы, тем не менее, говорили об этом, потому что это явно была технология, ожидающая своего момента прорыва. Постоянно публиковались статьи, модели и исследования, а такие конференции, как SIGGRAPH и NeurIPS, были заполнены инженерами по машинному обучению, которые сравнивали заметки и опирались на работу друг друга. Вот история визуального понимания, которую я написал в 2011 году!

Эта деятельность продолжается каждый день. Но поскольку ИИ стал большим бизнесом – возможно, крупнейшим в сфере технологий на данный момент – эти разработки приобрели немного больший вес, поскольку людям интересно, может ли одно из них быть таким же большим скачком от ChatGPT, каким ChatGPT был от своих предшественников.

Простая истина заключается в том, что ни одна из этих моделей не станет таким прорывом, поскольку развитие OpenAI основано на фундаментальном изменении в архитектуре машинного обучения, которую сейчас приняла каждая другая компания и которая не была заменена. Постепенные улучшения, такие как улучшение синтетического теста на одно или два пункта или немного более убедительный язык или изображения, — это все, на что нам остается надеяться в данный момент.

Означает ли это, что ни одна из этих моделей не имеет значения? Конечно. Вы не можете обновить версию 2.0 до 3.0 без версий 2.1, 2.2, 2.2.1 и т. д. И иногда эти достижения значительны, исправляя серьезные недостатки или выявляя неожиданные уязвимости. Мы стараемся охватить самое интересное, но это лишь часть от общего числа. В настоящее время мы работаем над статьей, в которой собраны все модели, о которых, по нашему мнению, любопытные люди ML должны знать, и их около дюжины.

ЧИТАТЬ   Бесплатный базовый цвет Tesla для моделей 3 и Y только что изменился

Не волнуйтесь: когда произойдет серьезная проблема, вы узнаете об этом, и не только потому, что TechCrunch ее освещает. Для вас это будет так же очевидно, как и для нас.



Source

От admin