Используемые нейросети

Начало работы в сервисе

Полагаться на одну-единственную нейросеть для обслуживания клиентов, автоматизации маркетинговых кампаний, написания статей, создания изображений или любых других задач, связанных с ИИ, — стратегия достаточно рискованная. Ведь порой чат-боты бывают недоступны по независящим от нас причинам – из-за сбоев на сервере компании, большого наплыва пользователей и т.д.

Представьте, что все идет гладко, контент почти создан, но вдруг ваш ИИ-помощник выходит из строя на неопределенный срок. Как раз для подобных случаев в Mitup AI представлены несколько нейросетей одновременно. Вы можете легко переключаться между ними, чтобы не прерывать работу и использовать оптимальный чат для каждой конкретной задачи. Список нейросетей регулярно пополняется.

На данный момент в сервисе доступны нейросети:

Gemini;
LLaMa;
OpenAI;

Все представленные модели относятся к большим языковым моделям – LLM (от англ. Large Language Model, прим.ред.). LLM – это языковая модель на базе нейронной сети, обученная на миллиардах параметров и предназначенная для выполнения задач обработки естественного языка. LLM способны генерировать и распознавать различный контент (текст, видео, аудио, программный код), отвечать на вопросы, выполнять перевод и другие сложные задачи.

Сравнение нейросетей по различным метрикам:

Данные взяты из сравнительного анализа, проведенного Artificial Analysis.

1. Gemini:

Gemini – нейросеть на основе искусственного интеллекта, разработанная командой Google DeepMind. Семейство Gemini содержит несколько универсальных моделей и их версии:

Ultra. Версия 1.0 Ultra: Мультимодальная модель, отличающаяся высокой производительностью в области кодирования и решения математических задач.
Pro. Версии 1.0 Pro; 1.5 Pro; 1.5 Pro-latest: Мультимодальная модель с расширенным контекстным окном для повышения производительности в широком спектре задач.
Flash. Версия 1.5 Flash: Быстрая мультимодальная модель, способная эффективно обрабатывать часы видео и аудио, а также сотни тысяч слов или строк кода.
Nano. Версия 1.0 Nano: Легкая базовая модель для локального применения на мобильных устройствах.

Характеристики моделей Gemini Pro

Модель	Контекстное окно	Для чего предназначена	Поддержка языков	Знания
gemini-1.0-pro	до 32 000	Способен на создание контента, редактирование, обобщение и классификацию данных	38 шт, включая Русский	Обучена на данных до 01.12.2023
gemini-1.5-pro	до 128 000	Решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода	38 шт, включая Русский	Обучена на данных до 01.02.2024
gemini-pro-1.5-latest	до 1 000 000	Сложные логические задачи: генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных	38 шт, включая Русский	Обучена на данных до 01.05.2024

Каждая модель Gemini содержит собственный набор уникальных характеристик, предназначенных для решения определенных задач. Компания пропагандирует ответственный подход к разработкам в сфере искусственного интеллекта, поэтому все модели проходят специальные тесты на этичность и безопасность.

2. LLaMa:

LLaMa – это большая языковая модель, разработанная Meta AI. Семейство содержит 3 поколения моделей: Llama, Llama 2, Llama 3.

Llama: Коллекция базовых моделей с параметрами от 7B до 65B параметров.
Llama 2: набор предварительно подготовленных и точно настроенных LLM с открытым исходным кодом. Содержат от 7 до 70 миллиардов параметров и модель Llama 2-Chat, предназначенную для диалоговых вариантов использования.
Llama 3: самые мощные модели семейства с открытым исходным кодом. Содержат от 8B до 70B параметров. Демонстрируют современные показатели в широком спектре отраслевых тестов и предлагают новые возможности, включая улучшенную логику. Данные, на которых обучены версии Llama 3, основываются на более чем 15 трлн токенов из общедоступных онлайн-источников, что в семь раз больше, чем набор данных, использованный для Llama 2, и являются решающим фактором повышения производительности. Также сюда включены высококачественные неанглоязычные данные, с целью последующей поддержки мультиязычных приложений.

Характеристики моделей Llama

Модель	Контекстное окно	Для чего предназначена	Поддержка языков	Знания
llama 1-7B	до 2 000 токенов	Генерация кода, написание текстовых заметок	Многоязычная поддержка, до 20 языков	Обучена на данных до 01.02.2023
llama 1-30B	до 2 000 токенов	Модель общего назначения, подходящая для генерации текста, диалогов и других задач обработки естественного языка.	Многоязычная поддержка, до 20 языков	Обучена на данных до 01.02.2023
llama 2-13B	до 4 000 токенов	Подходит для задач генерации текста и диалоговых сценариев	Основное использование на английском, с возможностью дообучения для других языков.	Обучена на данных до сентября 2022 года, с дообучением на более новых данных до июля 2023 года
llama 2-Chat (70B)	до 4 000 токенов	Создание контент-плана, глубокий анализ и понимание данных, поддержание диалога	До 20 языков	Обучена на данных до 01.07.2023
llama3-8B	до 8 000 токенов	Диалог с пользователем на различные темы, создание сложной документации, понимание сотен строк кода	36 языков	Обучена на данных до 01.12.2023
llama3-70B	до 100 000 токенов	Самая мощная модель в семействе, подходящая для обработки сложных задач, таких как логическое мышление, креативное письмо, программирование и диалоги.	36 языков	Обучена на данных до 01.05.2024

Llama 3 – это важный этап в эволюции LLM с открытым исходным кодом, который расширяет границы производительности, возможностей и методов ответственной разработки. Благодаря инновационной архитектуре, обширному набору обучающих данных и методам тонкой настройки, модели устанавливают новые современные стандарты для LLM в масштабах до 70 миллиардов параметров.

3. OpenAI

OpenAI - научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта.

ChatGPT - это чат-бот от OpenAI, созданный на основе генеративного искусственного интеллекта. Текущие версии ChatGPT поддерживают функцию памяти – запоминают детали диалога и могут строить ответы на основе информации, полученной ранее от пользователя. Компания выпускает языковые модели – GPT и графические – Dall-e, которые интегрируются в чат-бот.
GPT-3 - первая базовая модель. Способна генерировать текст, но плохо понимает контекст. В ChatGPT уже не используется.
GPT-3.5 - Усовершенствованная версия GPT-3.5, предоставляющая более высокую точность и возможности для выполнения сложных задач обработки естественного языка.
GPT-3.5-Turbo – оптимизированная версия GPT-3.5, более быстрая и эффективная. Разработана для приложений, требующих высокой производительности и оптимизации затрат.
GPT-4 – самая мощная модель семейства, содержащая от 175B до 1 триллиона параметров. Она демонстрирует передовые показатели в различных отраслевых тестах и включает улучшенную обработку неанглоязычных данных. Модель более “гибкая” по сравнению с предыдущими, то есть способна давать креативные ответы на запросы пользователей и углубляться в контекст.
GPT-4o – новейшая мультимодальная модель, способная обрабатывать текст, аудио и графические данные и вести полноценный диалог с пользователем. Способна имитировать интонации человеческого голоса, распознавать и выражать эмоции. Эффективно справляется с большими объемами информации и сложными задачами.

Характеристики моделей Open AI

Модель	Контекстное окно	Для чего предназначена	Поддержка языков	Знания
GPT-3	2048 токенов	Обработка естественного языка, генерация текста, чат-боты, анализ текста и т.д.	Многоязычная поддержка, включая английский, испанский, французский, немецкий и многие другие	Обучена на данных до 2021 года
GPT-3.5	4096 токенов	Улучшенная обработка естественного языка, генерация текста, чат-боты, анализ текста с повышенной точностью и скоростью	Многоязычная поддержка, до 50 языков	Обучена на данных до 2023 года
GPT-3.5 Turbo	16 000 токенов	Более эффективная и быстрая обработка естественного языка, предназначена для приложений, требующих высокой производительности и оптимизации затрат	До 95 языков	Обучена на данных до середины 2023 года
GPT-4	32 768 токенов	Обработка естественного языка, генерация текста, чат-боты, анализ текста, более сложные и специализированные задачи	Многоязычная поддержка, включая английский, испанский, французский, немецкий и многие другие	Обучена на данных до сентября 2023 года
GPT-4o (omni)	128 000 токенов	Обработка текстовой, графической и аудио информации на вход и выход. Способность поддерживать полноценный диалог в режиме реального времени	Поддержка более 50 языков, включая улучшенные возможности для неанглийских языков.	Обучена на данных до октября 2023 года

Модели GPT от Open AI – одни из самых передовых и производительных в сфере искусственного интеллекта. Благодаря свой гибкости и адаптивности, они способны создавать высококачественный контент, вести диалог в режиме реального времени и могут применяться в различных областях, включая образование, медицину, промышленность и т.д.

Что такое контекстное окно и токен

Контекстное окно - количество входных токенов, которое модель может одновременно обрабатывать и использовать для формирования своего ответа. Это ключевая характеристика, определяющая объем информации, доступный модели для анализа на каждом этапе обработки. Контекстное окно может включать как текущие, так и предыдущие токены, предоставляя модели возможность учитывать как недавние, так и более отдаленные данные в своей предсказательной способности.

Токен - базовая единица текста, используемая в обработке естественного языка. В зависимости от подхода, токеном может быть слово, часть слова или символ. Процесс токенизации заключается в разбиении текста на такие единицы, что позволяет нейросетям обрабатывать и анализировать текстовую информацию на более мелком уровне детализации. Токены являются основными элементами, на которых обучаются и выполняют предсказания модели обработки естественного языка.

Что означают термины TPM, TPD, RPM, RPD

	Модель	Контекстное окно	Количество параметров	TPD (Токены в день)	TPM (Токены в минуту)	RPD (Запросы в день)	RPM (Запросы в минуту)
Gemini	Gemini-1.5-pro-latest	1 000 000	100 млрд	46 млн	32 000	10 000	360
LLaMa	llama 3-8b	8 000	8 млрд	3 млн	35 000	100 000	1000
GPT 3.5	GPT 3.5-Turbo	16 000	13 млрд	2 млн	40 000	200	20

TPM - Количество токенов, которые обрабатываются нейросетью в течение одной минуты. Это более детализированная метрика производительности, показывающая, как быстро модель может обрабатывать данные в реальном времени.

TPD - Количество токенов, которые обрабатываются нейросетью в течение одного дня. Токены могут быть отдельными словами или частями слов, в зависимости от метода токенизации. Эта метрика помогает оценить общий объём работы, которую выполняет модель за день.

RPM - Количество запросов, которые поступают к нейросети в течение одной минуты. Эта метрика позволяет оценить нагрузку на модель в короткие промежутки времени и может быть полезна для анализа пиковых нагрузок.

RPD - Количество запросов, которые поступают к нейросети в течение одного дня. Эта метрика показывает, насколько часто модель используется в течение дня.

Эти метрики важны для понимания производительности и масштабируемости нейросетевых моделей, а также для планирования ресурсов и оптимизации работы систем, использующих эти модели. Чем больше токенов и запросов обрабатывает нейросеть, тем она мощнее и эффективнее. Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.