Mitup AI

30.08.2024

Технологии & Нейросети

1 769

Обзор моделей Claude 3 и 3,5 от Anthropic – главного конкурента Open AI

Mitup AI

Пишу и редактирую статьи в Журнале. Веду Telegram-канал о работе сервиса

Новые нейросети и тарифы

+ бонус 30 руб. на счет

Начать

Если вы хоть немного интересуетесь нейросетями, то наверняка слышали про языковые модели от компании Anthropic, которые не просто догоняют, но и во многом превосходят конкурентов. Новинка Claude 3.5 Sonnet обошла GPT-4o в тестах на точность, производительность и выгодно отличается этичным подходом к генерации контента.

Как бывшие сотрудники OpenAI создали собственную нейросеть, которая опережает даже флагманские модели? Как получить доступ к Claude AI, купить Claude API из России в 2024 году, и почему разработчики удивляются результатам тестов – разбираем далее в статье.

История самого громкого ИИ-стартапа

Компанию Anthropic основали специалисты, ранее работавшие в OpenAI. Внутренние разногласия там начались еще в 2018 году, когда Илон Маск покинул совет директоров OpenAI, чтобы сосредоточиться на Tesla и SpaceX.

В 2019 году из OpenAI уволился вице-президент по исследованиям Дарио Амодей. Он руководил разработкой GPT-2 и GPT-3, но коммерческий уклон корпорации стал противоречить его ценностям. Дарио считал, что компания потеряла независимость, когда приняла $1 млрд. инвестиций от Microsoft. Следом за вице-президентом последовала его сестра Даниэла Амодей, лид-инженер GPT-3 Том Браун и еще 8 коллег.

В 2021 году экс-сотрудники OpenAI запустили стартап Claude AI. С первого дня компания работает под статусом благотворительной корпорации. Это означает, что Anthropic поддерживает идею эффективного альтруизма – поиска способов сделать мир лучше. Совет директоров Anthropic сосредоточен на разработке безопасных систем Claude для помощи обществу, сместив приоритет с прибыли.

Чем Claude отличается от конкурентов?

Нейросеть Claude разработана на базе языковой модели Constitutional AI с трансформенной архитектурой. Трансформеры идеально подходят для обработки последовательных данных, что видно на примере GPT-4, Gemini и LLama. Чем же от них отличается Claude?

Разработчики Anthropic модифицировали алгоритм обучения с помощью метода RLHF. Процесс начинается с обучения LM на размеченных данных с готовыми ответами. Затем люди-аннотаторы оценивают ответы модели на тестовые промпты, выбирая лучшие варианты.

На основе собранных оценок обучается отдельная модель вознаграждения. Ее задача – предсказывать, какой ответ люди посчитают хорошим, а какой – плохим. Модель-награда используется для оценки качества генераций.

Заключительный этап – дообучение базовой LM. Модель-награда используется для формирования сигнала, направляющего обучение в сторону генерации более предпочтительных ответов. Получается, что Claude Chat учитывает обратную связь от людей и корректирует ответы, опираясь на их оценки.

Нейросеть Claude воспринимает и обрабатывает информацию в различных форматах. Мультимодальность проявляется в анализе текста, интерпретации изображений, а также объединении текстовых и визуальных данных для генерации релевантных ответов. Самостоятельно создавать изображения, видео или аудио Claude AI на момент публикации статьи не умеет.

Обзор моделей Claude

В семейство входят три языковые модели: Claude Haiku, Claude Sonnet и Claude Opus, которые отличаются по цене и мощности. Все три модели работают с контекстным окном 200,000 токенов с возможностью расширения до 1,000,000 токенов по запросу.

Любопытно, что мощность моделей можно определить, исходя из их названия. “Haiku” отсылает нас к японским трехстишиям хайку, намекая на компактность и скорость модели, “Sonnet”, то есть “сонет” – стихотворение в 14 строк – говорит об оптимальном сочетании интеллекта и скорости, а самая мощная модель названа “Opus” в честь литературных опусов – художественных произведений больших форм.

Claude 3 Haiku

Дата релиза	4 марта 2024 года
Знания на уровне бакалавра	75,2%
Рассуждения на уровне выпускника	33,3%
Решение математических задач	38,9%
Генерация кода	75,9%
Рассуждения над текстом	78,4%
Решение сложных задач поэтапно	73,7%
Навык глубокого понимания контекста	89,2%
Общие знания	85,9%
Обработка документов	88,8%
Анализ научных диаграмм	86,7%

Модель ориентирована на корпоративное использование, при котором важны скорость и экономичность. Обработка 2,500 изображений и 400 судебных дел обойдется всего в $1.

Хайку в три раза быстрее аналогов. Модель в режиме реального времени анализирует большие объемы данных: квартальные отчеты, контракты и научные статьи. Claude 3 Haiku обрабатывает 21,000 токенов или 30 страниц в секунду.

Наряду со скоростью и доступностью, в Claude Haiku реализована безопасность корпоративного уровня. Разработчики Anthropic проводят тестирование, чтобы снизить вероятность вредоносных выводов и джейлбрейков. Дополнительные уровни защиты включают непрерывный мониторинг, безопасные методы кодирования, протоколы шифрования и контроль доступа к конфиденциальным данным.

Claude 3 Sonnet

Дата релиза	4 марта 2024 года
Знания на уровне бакалавра	79,0%
Рассуждения на уровне выпускника	40,4%
Решение математических задач	43,1%
Генерация кода	73,0%
Рассуждения над текстом	78,9%
Решение сложных задач поэтапно	82,9%
Навык глубокого понимания контекста	93,2%
Общие знания	89,0%
Обработка документов	89,5%
Анализ научных диаграмм	88,7%

Claude 3 Sonnet – бесплатная модель Claude, доступная на сайте Claude.ai. Регистрировать аккаунт нужно на иностранный номер и заходить с разрешенного IP, иначе профиль заблокируют. На платформе Claude установлен суточный лимит. Пользователь заранее получает уведомление, когда приближается к лимитному значению. Квота обновляется каждые 24 часа, а для снятия ограничений нужно приобрести подписку.

Sonnet умеет распознавать и анализировать изображения, диаграммы, расшифрует текст, написанный от руки, и определит фильм по кадру. Такой функционал есть и в ChatGPT, но пользоваться им можно только по подписке.

Claude Sonnet безупречно справляется с вопросами по типу «что такое коллаж» и способна объяснить сложные понятия простым языком. Модель “глубже” рассуждает по сравнению с Хайку, что подтверждается приростом бенчмарков. Однако, есть и минусы – Sonnet обучена на данных до августа 2023 года, и, соответственно, ей сложно поддерживать диалог на актуальные темы.

Claude 3 Opus

Дата релиза	4 марта 2024 года
Знания на уровне бакалавра	86,8%
Рассуждения на уровне выпускника	50,4%
Решение математических задач	60,1%
Генерация кода	84,9%
Рассуждения над текстом	83,1%
Решение сложных задач поэтапно	86,8%
Навык глубокого понимания контекста	96,4%
Общие знания	95,4%
Обработка документов	89,3%
Анализ научных диаграмм	88,1%

Claude 3 Opus – самая умная модель семейства для поэтапного решения задач повышенной сложности. Ее бенчмарки по некоторым тестам на 10-20% выше, чем у Claude 3 Haiku.

Мощность модели наглядно демонстрирует следующий кейс: пользователь Twitter загрузил в нейросеть 65 подкастов одновременно. Через 33 минуты Claude 3 Opus извлекла из подкастов все рекомендации книг, идеи и полезные советы. Анализ 1 500 000 токенов обошелся пользователю в $23.

Сами Anthropic проверили “сообразительность” Opus при помощи метода «иголка в стоге сена». Он позволяет тестировать и классифицировать интеллектуальные возможности ИИ-моделей. Среди огромного количества материалов, посвященных разработке ПО, специалисты разместили неожиданную информацию про… пиццу. Claude 3 Opus с проверкой справилась отлично – не только обнаружила «иглу», но и догадалась, что ее тестируют.

Claude 3.5 Sonnet

Дата релиза	21 июня 2024 года
Знания на уровне бакалавра	88,7%
Рассуждения на уровне выпускника	59,4%
Решение математических задач	71,1%
Генерация кода	92,0%
Рассуждения над текстом	87,1%
Решение сложных задач поэтапно	86,8%
Навык глубокого понимания контекста	93,1%
Обработка документов	95,2%
Анализ научных диаграмм	94,7%

Новейшая модель Anthropic – Claude 3.5 Sonnet – поставила рекорды в сферах аналитического мышления, академических знаний и программировании. В ближайшем будущем ожидается пополнение семейства 3.5 версиями Haiku и Opus

Особенно заметны улучшения в понимании контекста, юмора и сложных инструкций, а также в создании контента с естественным слогом. Нейросеть успешно справилась с 64% задач по программированию, тогда как предыдущая версия – Claude 3 Opus – решила лишь 38%.

Вместе с обновлением модели состоялся релиз новой функции – Artifacts. Теперь Claude может в соседнем окне создавать динамичные объекты: сайты, симуляции законов физики, анимацию, диаграммы, svg и др. Функция Artifacts активируется автоматически.

Теперь в ответ на условный запрос «сделай сайт» чат будет делиться на две части. Слева продолжится диалог с Claude, где можно попросить увеличить кнопку или сменить шрифт. В правой – отобразится готовый макет сайта, над которым ведется работа.

29 августа 2024 года Anthropic объявила, что Artifacts теперь доступны всем пользователям Claude AI, даже по бесплатной подписке.

Новинка также доступна и для внедрения сторонними разработчиками – можно получить claude 3.5 sonnet api key в консоли Anthropic. Пошагово процесс описываем в последнем разделе статьи.

Сравнение бенчмарков Claude, ChatGPT и Gemini

Бенчмарки Claude AI в сравнении с GPT-4o

Лидерство в рейтинге ИИ-моделей удерживают:

GPT-4o.
Claude 3.5 Sonnet.
Gemini 1.5 Pro Advanced.

Claude 3.5 Sonnet превосходит Claude 3 Opus по всем бенчмаркам. Улучшения наиболее заметны для задач, требующих визуального мышления. Claude 3.5 Sonnet точнее распознает текст на размытых изображениях, извлекает максимум информации со схем и диаграмм.

Языковая модель Anthropic по результатам тестов лидирует в программировании, особенно в создании графических интерфейсов. Claude 3.5 Sonnet значительно превосходит GPT-4o, Gemini 1.5 по скорости генерации кода и текста. В логических задачах модели показали сопоставимые результаты. GPT-4o удерживает первое место в решении сложных математических задач за счет более точных результатов и лучшего форматирования формул.

Как пользоваться Claude, находясь в РФ?

Как зарегистрироваться в Claude? Сервисы Anthropic доступны в 159 странах. Россия в их список не входит. Для использования Claude в РФ требуется сменить российский IP-адрес на иностранный, получить телефонный номер разрешенной страны и пройти регистрацию через e-mail или Google.

Какие сложности тут могут возникнуть?

Anthropic часто блокирует аккаунты Claude даже после смены региона. Приходится повторно искать иностранные номера и сервисы переключения IP для обхода ограничений.
Нужно выполнить определенный набор действий, чтобы приобрести номер телефона другой страны.
Аккаунт могут заблокировать, если выполнять вход из разных стран.
Регистрация через Google возможна только на английском языке.

Как пользоваться Claude напрямую из РФ?

Самый доступный способ пользоваться Claude в России – найти удобную платформу-агрегатор. Такую, как онлайн-сервис Mitup AI. На сайте представлены все самые популярные нейросети: ChatGPT, Gemini и LLaMa. Чтобы пользоваться чат-ботами напрямую из РФ и без сложностей, которые мы описали выше, нужно только выполнить простую регистрацию через свой e-mail. Также в Mitup AI доступны 3 бесплатные генерации в день для неавторизованных пользователей.

Где получить Claude API для разработки?

Anthropic предоставляет доступ к своим языковым моделям через API, то есть позволяет “скачать” Claude. Разработчики могут получить Claude AI API key и внедрять нейросеть в свои приложения, не ограничиваясь окном браузера.

Чтобы получить доступ к Claude 3 API и Claude 3.5 API:

Смените страну подключения.
Перейдите в панель для разработчиков.
Введите e-mail компании или войдите через Google.
Введите имя и подтвердите совершеннолетие.
Укажите название организации, область работы, ссылку на корпоративный сайт.
В консоли найдите раздел «Get API keys», создайте и скопируйте первый Claude API key.

Стандартный тарифный план имеет ограничение 4,000 запросов в минуту. Актуальные цены за генерации моделей Claude 2.0-3.5 можно посмотреть на официальном сайте. Если планируется нагрузка посерьезнее, выбирайте кастомный тариф с ежемесячной оплатой и поддержкой от Anthropic.

Несмотря на географические ограничения, пользователи из РФ могут получить доступ к флагманским нейросетям, используя российские онлайн-сервисы и методы обхода блокировок. По мере развития и совершенствования Claude, можно ожидать, что модели Anthropic станут одним из ключевых инструментов в области ИИ и продолжат открывать новые возможности для бизнеса, науки и творчества.

Привет!
Задайте мне любой вопрос

12:23

#ИИ-модели

#Познавательное

1 минут

Обзор моделей Claude 3 и 3,5 от Anthropic – главного конкурента Open AI

История самого громкого ИИ-стартапа

Чем Claude отличается от конкурентов?

Обзор моделей Claude

Claude 3 Haiku

Claude 3 Sonnet

Claude 3 Opus

Claude 3.5 Sonnet

Сравнение бенчмарков Claude, ChatGPT и Gemini

Как пользоваться Claude, находясь в РФ?

Где получить Claude API для разработки?

Конференция TECH WEEK пройдет 17-19 ноября в инновационном кластере «Ломоносов»

Mitup AI: новый интерфейс, новые возможности, новые эмоции

ИИ-революция: объявлены лауреаты Премии «AI-Олимп-2025»

Чат-боты