Меня зовут Андрей Цыган — я не программист, я смотрю на технологии ИИ с точки зрения человека, который знает, чего хочет, но не имеет навыков делать это через код.
То есть он мог дать формулы для Экселя или рассказать пошагово, как это сделать – но надо было делать самому – и это было самым слабым звеном.
Но с новым плагином Интерпретатор кода правила игры изменились. Сейчас он не говорит как, а теперь говорит. И это выглядит фантастически для некодеров!
Мало того, что это выглядит – мне кажется, это кардинальное изменение правил игры – многие приложения, практичные, классные, могут подвергнуться кардинальным изменениям. Нет необходимости в интерфейсах, руководствах — просто скажите, что вы хотите, и вы это получите. Конечно не все, но меня впечатляет быстрота улучшений.
Я на личном опыте видел, как человек может “прыгать” по уровням взаимодействия с интерфейсом. Бабушка, 74 года, телефон кнопочный, планшета нет (не хотела никуда тыкать пальцем), про ютуб не слышала. Но когда она приедет в гости, то знает – только скажи “Алиса, организуйте мне концерт Надежды Кадышевой, где она с молодым баянистом в Витебске” – и все! Здесь тоже может сработать.
Contents
Что такое интерпретатор кода?
Code Interpreter — это плагин OpenAI для ChatGPT. Он позволяет создавать и запускать код прямо в интерфейсе и может работать со скачанными файлами.
Долгое время он находился в закрытом тестировании, но теперь становится доступен и простым смертным, с подпиской Plus ($20 в месяц). Работает с моделью GPT-4
Подключаем его в настройках.

Затем в окне модели выберите Интерпретатор кода

Загрузка файла
Теперь у нас есть возможность загружать файлы размером до 100 МБ.
Это может быть ваша база данных, ваши расчеты в Excel, pdf файлы, мультимедийные файлы. В общем – 100Мб вполне где развернуться.
Но это только слова, главный вопрос “Что я могу сделать с этим, что я могу сделать с этим?” “.
Я протестировал несколько реальных задач, уверен в ближайшее время мы увидим сотни крутых кейсов. Пишите свои кейсы в комментариях – буду благодарен.
Все примеры, которые я собираюсь показать, реальные, от компаний (малого бизнеса). У крупных компаний, наверное, другие потребности — ну, другие ресурсы.
Анализ данных
В малом бизнесе у вас может не быть колл-центра, маркетинга, а иногда даже продаж, но всегда будут налоги и Excel. Начнем со второго.
Вообще все наши мелкие данные часто размещаются в Excel — это рекламные мероприятия, выгрузки из CRM, движения по банку.
Анализ рынка
Для теста возьмем открытые данные.
ISO публикует ежегодный отчет о количестве действующих сертификатов по странам и стандартам. Скачать и скачать на него файл, без подготовки.
Дай мне количество сертификатов по русскоязычным странах по стандартам, и посчитай общее количество выданных сертификатов как по стандарту так и по стране
Все просьбы я писал очень простым языком, т.е. “это то, что вам нужно, и все”. Посмотрите сами на столбцы, поймите, где данные. Пробовал имитировать позицию пользователя, есть набор данных – хочу ответы в виде графиков и диаграмм.

Это данные, которые мы получаем за минуту (он сначала просматривает данные, пробует их, оценивает их), а затем быстро создает необходимые выходные данные.
Просим вас построить из таблицы вертикальный график по ISO 9001

Вот тепловая карта по количеству и по стране

А вот и топ-10 отраслей по стандарту ISO 9001 Беларуси.

По его словам, он может строить эти типы диаграмм (но что-то мне подсказывает, что скоро умные люди найдут способ расширить этот список)
В моей текущей среде я могу строить следующие типы графиков, используя библиотеку matplotlib:
-
Линейные графики: используется для визуализации данных во времени (называемых «временными рядами») или для отображения взаимосвязи между двумя наборами данных.
-
Гистограммы: Используется для сравнения значений разных категорий или групп.
-
Гистограммы: Используется для визуализации распределения одномерного набора данных.
-
Облака точек: используется для визуализации связи между двумя наборами данных.
-
Блочные диаграммы: позволяет визуализировать статистические свойства распределения данных (медиану, квартили, выбросы и т. д.).
-
Круговые диаграммы: Используется для отображения пропорций различных категорий в сумме.
-
Тепловые карты: Используется для отображения матрицы данных, где цвет каждой ячейки соответствует значению этой ячейки.
-
Планки погрешностей: Используется для визуализации неопределенности или вариации данных.
Эти данные могут быть немедленно запрошены в формате PDF или PPT.

Работа над распознаванием счетов в формате PDF
Инвойс, инвойс, акт – таких мы получаем в бизнесе много, и приходится вручную вводить в нашу платежную систему – кому, за что и сколько платить.
Попросите распознать текст и выделить платежные данные.

Давайте даже не будем брать самый простой тип счета, это скорее соглашение о счете. Есть как текстовая часть, так и табличная. Наша задача определить, кому платить, сколько платить и за что платить.
Загружаем файл и по-человечески просим предоставить данные:

Единственное НО – с русским языком пишет, что не может работать, библиотеки нет(
работа со звуком
Мне не удалось распознать текст аудио ни на русском, ни на английском языке. Я уверен, что вы можете предложить библиотеки, и, возможно, это может сделать что-то лучше, но я знаю только одну библиотеку – их. Ленин.
Но может выполнять простые процедуры – например, нарезка аудио на необходимое количество частей (с максимальным размером и длительностью) Это может понадобиться, например, когда поток приложения не берет не большой файл, а вы должны разделить его.
Например, Whisper, которым я успел воспользоваться, ест файлы только до 18 минут, и разбивать длинные видео на эти куски было нецелесообразно. Теперь это легко

Работа с изображениями
Поместите текст на изображение.
Я пытался написать текст на изображении, но в такой редакции он напрочь отказался.

А вот если поменять задачу на “нанести водяной знак” – пишет. Немного ругается на шрифты, но пишет. Пишет очень мелким шрифтом, даже размер шрифта указан, но пока что я могу это сделать. Но МОЖЕТ!


В общем, простые моменты с изображением можно делать – поворот, инверсия, изменение формата.
Работа с видео
Он может конвертировать GIF в MP4, выполнять простое редактирование видео, например масштабирование, и создавать GIF.
В твиттере Райли Гудсайд есть рабочие примеры с видео
Я попытался исправить проблему, которую недавно исправил в CapCut. Сделайте единообразное видео по изображению (слайду). Тоже выполнил эту задачу, вот результат:
Краткое содержание
Лично для меня этот плагин стал открытием “ящика Пандоры”. Ключом является просьба, не только инструкция, но и конечный результат.
Думаю, это может пошатнуть позиции некоторых утилит — теперь можно будет много чего делать внутри chatgpt.
Он часто мне отвечал, что у него нет такой-то библиотеки — я с удовольствием представляю, как будет играть этот плагин, если туда можно будет загрузить нужные библиотеки