В генеративном Бум искусственного интеллекта, данные — это новая нефть. Так почему бы тебе не продать свою?

От крупных технологических компаний до стартапов, создатели ИИ лицензируют электронные книги, изображения, видео, аудиофайлы и многое другое у брокеров данных, и все это с целью сделать продукты на основе ИИ более эффективными (и более юридически защищенными). Shutterstock заключил соглашения с Meta, Google, Amazon и Apple на предоставление миллионов изображений для обучения моделей, а OpenAI заключила соглашения с несколькими новостными организациями для обучения своих моделей на архивах новостей.

Во многих случаях отдельные создатели и владельцы этих данных не видели, чтобы ни копейки денег переходили из рук в руки. Стартап под названием Старый хочет это изменить.

Анна Казлаускас и Арт Абал, которые встретились на занятиях в медиалаборатории Массачусетского технологического института, посвященных созданию технологий для развивающихся рынков, стали сооснователями Vana в 2021 году. До Ваны Казлаускас изучал информатику и экономику в Массачусетском технологическом институте, который в конечном итоге покинул, чтобы запустить финтех. Стартап по автоматизации Iambiq на Y Combinator. Абал, бизнес-юрист по образованию и образованию, был партнером The Cadmus Group, консалтинговой фирмы в Бостоне, а затем возглавил закупки в фирме по аннотированию данных Appen.

Вместе с Ваной Казлаускас и Абал намеревались создать платформу, которая позволит пользователям «агрегировать» свои данные, включая чаты, голосовые записи и фотографии, в наборы данных, которые затем можно будет использовать для обучения генеративных моделей ИИ. Они также хотят создавать более персонализированный опыт — например, ежедневные мотивационные голосовые сообщения, основанные на ваших целях в отношении здоровья, или приложение для создания произведений искусства, которое понимает ваши предпочтения в стиле — путем уточнения общедоступных моделей на основе этих данных.

«Инфраструктура Vana фактически создает сокровищницу данных, принадлежащих пользователям», — сказал Казлаускас TechCrunch. «Он делает это, позволяя пользователям агрегировать свои личные данные неконсервативным способом… Vana позволяет пользователям владеть моделями ИИ и использовать свои данные в приложениях ИИ». »

Вот так Ваня представляет свою платформу и API разработчикам:

API Vana соединяет межплатформенные личные данные пользователя… чтобы вы могли персонализировать свое приложение. Ваше приложение получает мгновенный доступ к пользовательской модели искусственного интеллекта или базовым данным, что упрощает адаптацию и устраняет проблемы с вычислительными затратами… Мы считаем, что пользователи должны иметь возможность импортировать свои личные данные из закрытых садов, таких как Instagram, Facebook и Google, в ваше приложение, поэтому вы можете создать потрясающий персонализированный опыт с момента первого взаимодействия пользователя с вашим потребительским приложением искусственного интеллекта.

Создать учетную запись в Vana довольно просто. Подтвердив свой адрес электронной почты, вы можете прикрепить данные к цифровому аватару (например, селфи, описание себя и голосовые записи) и изучить приложения, созданные с использованием платформы и наборов данных от Vana. Выбор приложений варьируется от чат-ботов в стиле ChatGPT и интерактивных сборников рассказов до генератора профилей Hinge.

Авторы изображений: Старый

Вы можете спросить: почему в эпоху растущей осведомленности о конфиденциальности данных и атак программ-вымогателей кто-то может передавать свою личную информацию анонимному стартапу, не говоря уже о стартапе, финансируемом венчурным капиталом? (Vana уже привлекла 20 миллионов долларов от Paradigm, Polychain Capital и других спонсоров.) Можно ли действительно доверять коммерческой компании, которая не будет злоупотреблять или неправильно управлять монетизируемыми данными, которые она предоставляет?

Вана Реддит ДАО

Авторы изображений: Старый

Отвечая на этот вопрос, Казлаускас подчеркнул, что главная цель Vana состоит в том, чтобы пользователи «вернули себе контроль над своими данными», отметив, что пользователи Vana имеют возможность размещать свои данные самостоятельно, а не хранить их на серверах Vana, и контролировать, как их данные размещаются. данные передаются приложениям и разработчикам. Она также утверждала, что, поскольку Vana зарабатывает деньги, взимая с пользователей ежемесячную подписку (начиная с 3,99 доллара США) и взимая с разработчиков комиссию за «транзакцию данных» (например, за передачу наборов данных для обучения моделей ИИ), у компании нет стимула эксплуатировать пользователей и кладезь личных данных, которые они приносят с собой.

ЧИТАТЬ   В Ханты-Мансийском автономном округе для ветеранов Северного военного округа подготовили специальные квартиры для реабилитации

«Мы хотим создавать модели, которыми владеют и управляют пользователи, которые приносят свои данные», — сказал Казлаускас, — «и позволить пользователям переносить свои данные и модели с собой в любое приложение».

Теперь, пока Старый не продает пользовательские данные компаниям для обучения генеративным моделям ИИ (по крайней мере, так утверждает), он хочет позволить пользователям делать это самостоятельно, если они захотят, начиная с своих постов на Reddit.

В этом месяце Вана запустила то, что она называет Reddit Data DAO (Цифровая автономная организация), программа, которая объединяет данные Reddit нескольких пользователей (включая их карму и историю публикаций) и позволяет им вместе решать, как использовать эти объединенные данные. После присоединения к учетной записи Reddit отправьте запрос на Reddit для получения своих данных и загружая эти данные в DAO, пользователи получают право голосовать вместе с другими членами DAO по таким решениям, как лицензирование объединенных данных компаниям, занимающимся генерацией ИИ, для получения общей прибыли.

Это своего рода ответ на недавние шаги Reddit по коммерциализации данных на своей платформе.

Ранее Reddit не гарантировал доступ к публикациям и сообществам для целей обучения генеративному ИИ. Но в конце прошлого года, перед IPO, компания изменила курс. С момента изменения политики Reddit получил более 203 миллионов долларов лицензионных сборов от компаний, включая Google.

«Общая идея [with the DAO is] освободить пользовательские данные от крупных платформ, которые стремятся их накапливать и монетизировать», — сказал Казлаускас. «Это первая и часть наших усилий, направленных на то, чтобы помочь людям объединить свои данные в принадлежащие пользователям наборы данных для обучения моделей ИИ».

ЧИТАТЬ   Поддержка США жизненно важна для выживания Украины, заявил премьер-министр Японии Конгрессу

Неудивительно, что Reddit, который официально не сотрудничает с Vana, недоволен DAO.

Реддит забанил Вану субреддит посвящен обсуждению DAO. А представитель Reddit обвинил Vana в «эксплуатации» своей системы экспорта данных, разработанной в соответствии с правилами конфиденциальности данных, такими как GDPR и Калифорнийский закон о конфиденциальности потребителей.

«Наши механизмы обработки данных позволяют нам поставить барьеры в отношении этих организаций, даже в отношении публичной информации», — сказал представитель TechCrunch. «Reddit не передает непубличные персональные данные коммерческим компаниям, и когда пользователи Reddit запрашивают у нас экспорт своих данных, они получают от нас непубличные персональные данные в соответствии с действующим законодательством. Прямые партнерские отношения между Reddit и утвержденными организациями с четкими условиями и обязанностями, а также эти партнерские отношения и соглашения предотвращают неправомерное использование и злоупотребление данными людей.

Но есть ли у Reddit реальная причина для беспокойства?

Казлаускас предполагает, что DAO вырастет до такой степени, что это будет влиять на то, сколько Reddit может взимать с клиентов за свои данные. Это далеко не так, если предположить, что это когда-нибудь произойдет; В DAO насчитывается чуть более 141 000 участников, что составляет лишь небольшую часть от 73 миллионов пользователей Reddit. И некоторые из этих участников могут быть ботами или дубликатами учетных записей.

Кроме того, возникает вопрос о том, как справедливо распределить платежи, которые DAO может получить от покупателей данных.

В настоящее время DAO выдает «токены» — криптовалюту — пользователям, соответствующим их Reddit. карма. Но карма, возможно, не лучший показатель качества вкладов в наборы данных, особенно в небольших сообществах Reddit, у которых меньше возможностей зарабатывать вклады.

Казлаускас выдвигает идею о том, что члены DAO могут делиться своими кроссплатформенными и демографическими данными, что делает DAO потенциально более ценным и стимулирует регистрацию. Но это также потребует от пользователей еще большего доверия Vana к ответственному обращению со своими конфиденциальными данными.

ЧИТАТЬ   Получите оперативные советы от Airbnb и Instacart на этапе строителей TC Disrupt 2023.

Лично я не думаю, что DAO Ваны достигнет критической массы. Препятствия, стоящие на пути, слишком многочисленны. Однако я подозреваю, что это будет не последняя популярная попытка установить контроль над данными, которые все чаще используются для обучения генеративных моделей ИИ.

Такие стартапы, как Spawning, работают над тем, чтобы создатели могли ввести правила, регулирующие использование их данных в учебных целях, в то время как такие поставщики, как Getty Images, Shutterstock и Adobe, продолжают экспериментировать со схемами компенсации. Но никто еще не взломал код. Может ли это даже быть трескаться? Учитывая головорез природа Для индустрии генеративного искусственного интеллекта это, безусловно, непростая задача. Но, возможно, кто-то найдет способ – или политики вынудят его.



Source

От admin