Если вы хоть немного интересуетесь нейросетями, то наверняка слышали про языковые модели от компании Anthropic, которые не просто догоняют, но и во многом превосходят конкурентов. Новинка Claude 3.5 Sonnet обошла GPT-4o в тестах на точность, производительность и выгодно отличается этичным подходом к генерации контента.

Как бывшие сотрудники OpenAI создали собственную нейросеть, которая опережает даже флагманские модели? Как получить доступ к Claude AI, купить Claude API из России в 2024 году, и почему разработчики удивляются результатам тестов – разбираем далее в статье.

История самого громкого ИИ-стартапа

Компанию Anthropic основали специалисты, ранее работавшие в OpenAI. Внутренние разногласия там начались еще в 2018 году, когда Илон Маск покинул совет директоров OpenAI, чтобы сосредоточиться на Tesla и SpaceX.

В 2019 году из OpenAI уволился вице-президент по исследованиям Дарио Амодей. Он руководил разработкой GPT-2 и GPT-3, но коммерческий уклон корпорации стал противоречить его ценностям. Дарио считал, что компания потеряла независимость, когда приняла $1 млрд. инвестиций от Microsoft. Следом за вице-президентом последовала его сестра Даниэла Амодей, лид-инженер GPT-3 Том Браун и еще 8 коллег.

В 2021 году экс-сотрудники OpenAI запустили стартап Claude AI. С первого дня компания работает под статусом благотворительной корпорации. Это означает, что Anthropic поддерживает идею эффективного альтруизма – поиска способов сделать мир лучше. Совет директоров Anthropic сосредоточен на разработке безопасных систем Claude для помощи обществу, сместив приоритет с прибыли.

Чем Claude отличается от конкурентов?

Нейросеть Claude разработана на базе языковой модели Constitutional AI с трансформенной архитектурой. Трансформеры идеально подходят для обработки последовательных данных, что видно на примере GPT-4, Gemini и LLama. Чем же от них отличается Claude?

Разработчики Anthropic модифицировали алгоритм обучения с помощью метода RLHF. Процесс начинается с обучения LM на размеченных данных с готовыми ответами. Затем люди-аннотаторы оценивают ответы модели на тестовые промпты, выбирая лучшие варианты.

Алгоритм обучения нейросети Claude AI
Алгоритм обучения нейросети Claude AI

На основе собранных оценок обучается отдельная модель вознаграждения. Ее задача – предсказывать, какой ответ люди посчитают хорошим, а какой – плохим. Модель-награда используется для оценки качества генераций.

Заключительный этап – дообучение базовой LM. Модель-награда используется для формирования сигнала, направляющего обучение в сторону генерации более предпочтительных ответов. Получается, что Claude Chat учитывает обратную связь от людей и корректирует ответы, опираясь на их оценки.

Нейросеть Claude воспринимает и обрабатывает информацию в различных форматах. Мультимодальность проявляется в анализе текста, интерпретации изображений, а также объединении текстовых и визуальных данных для генерации релевантных ответов. Самостоятельно создавать изображения, видео или аудио Claude AI на момент публикации статьи не умеет.

Обзор моделей Claude

В семейство входят три языковые модели: Claude Haiku, Claude Sonnet и Claude Opus, которые отличаются по цене и мощности. Все три модели работают с контекстным окном 200,000 токенов с возможностью расширения до 1,000,000 токенов по запросу.

Любопытно, что мощность моделей можно определить, исходя из их названия. “Haiku” отсылает нас к японским трехстишиям хайку, намекая на компактность и скорость модели, “Sonnet”, то есть “сонет” – стихотворение в 14 строк – говорит об оптимальном сочетании интеллекта и скорости, а самая мощная модель названа “Opus” в честь литературных опусов – художественных произведений больших форм.

Claude 3 Haiku

Дата релиза 4 марта 2024 года
Знания на уровне бакалавра 75,2%
Рассуждения на уровне выпускника 33,3%
Решение математических задач 38,9%
Генерация кода 75,9%
Рассуждения над текстом 78,4%
Решение сложных задач поэтапно 73,7%
Навык глубокого понимания контекста 89,2%
Общие знания 85,9%
Обработка документов 88,8%
Анализ научных диаграмм 86,7%

Модель ориентирована на корпоративное использование, при котором важны скорость и экономичность. Обработка 2,500 изображений и 400 судебных дел обойдется всего в $1.

Хайку в три раза быстрее аналогов. Модель в режиме реального времени анализирует большие объемы данных: квартальные отчеты, контракты и научные статьи. Claude 3 Haiku обрабатывает 21,000 токенов или 30 страниц в секунду.

Наряду со скоростью и доступностью, в Claude Haiku реализована безопасность корпоративного уровня. Разработчики Anthropic проводят тестирование, чтобы снизить вероятность вредоносных выводов и джейлбрейков. Дополнительные уровни защиты включают непрерывный мониторинг, безопасные методы кодирования, протоколы шифрования и контроль доступа к конфиденциальным данным.

Claude 3 Sonnet

Дата релиза 4 марта 2024 года
Знания на уровне бакалавра 79,0%
Рассуждения на уровне выпускника 40,4%
Решение математических задач 43,1%
Генерация кода 73,0%
Рассуждения над текстом 78,9%
Решение сложных задач поэтапно 82,9%
Навык глубокого понимания контекста 93,2%
Общие знания 89,0%
Обработка документов 89,5%
Анализ научных диаграмм 88,7%

Claude 3 Sonnet – бесплатная модель Claude, доступная на сайте Claude.ai. Регистрировать аккаунт нужно на иностранный номер и заходить с разрешенного IP, иначе профиль заблокируют. На платформе Claude установлен суточный лимит. Пользователь заранее получает уведомление, когда приближается к лимитному значению. Квота обновляется каждые 24 часа, а для снятия ограничений нужно приобрести подписку.

Sonnet умеет распознавать и анализировать изображения, диаграммы, расшифрует текст, написанный от руки, и определит фильм по кадру. Такой функционал есть и в ChatGPT, но пользоваться им можно только по подписке.

Claude Sonnet безупречно справляется с вопросами по типу «что такое коллаж» и способна объяснить сложные понятия простым языком. Модель “глубже” рассуждает по сравнению с Хайку, что подтверждается приростом бенчмарков. Однако, есть и минусы – Sonnet обучена на данных до августа 2023 года, и, соответственно, ей сложно поддерживать диалог на актуальные темы.

Claude 3 Opus

Дата релиза 4 марта 2024 года
Знания на уровне бакалавра 86,8%
Рассуждения на уровне выпускника 50,4%
Решение математических задач 60,1%
Генерация кода 84,9%
Рассуждения над текстом 83,1%
Решение сложных задач поэтапно 86,8%
Навык глубокого понимания контекста 96,4%
Общие знания 95,4%
Обработка документов 89,3%
Анализ научных диаграмм 88,1%

Claude 3 Opus – самая умная модель семейства для поэтапного решения задач повышенной сложности. Ее бенчмарки по некоторым тестам на 10-20% выше, чем у Claude 3 Haiku.

Мощность модели наглядно демонстрирует следующий кейс: пользователь Twitter загрузил в нейросеть 65 подкастов одновременно. Через 33 минуты Claude 3 Opus извлекла из подкастов все рекомендации книг, идеи и полезные советы. Анализ 1 500 000 токенов обошелся пользователю в $23.

Сами Anthropic проверили “сообразительность” Opus при помощи метода «иголка в стоге сена». Он позволяет тестировать и классифицировать интеллектуальные возможности ИИ-моделей. Среди огромного количества материалов, посвященных разработке ПО, специалисты разместили неожиданную информацию про… пиццу. Claude 3 Opus с проверкой справилась отлично – не только обнаружила «иглу», но и догадалась, что ее тестируют.

Claude 3.5 Sonnet

Дата релиза 21 июня 2024 года
Знания на уровне бакалавра 88,7%
Рассуждения на уровне выпускника 59,4%
Решение математических задач 71,1%
Генерация кода 92,0%
Рассуждения над текстом 87,1%
Решение сложных задач поэтапно 86,8%
Навык глубокого понимания контекста 93,1%
Обработка документов 95,2%
Анализ научных диаграмм 94,7%

Новейшая модель Anthropic – Claude 3.5 Sonnet – поставила рекорды в сферах аналитического мышления, академических знаний и программировании. В ближайшем будущем ожидается пополнение семейства 3.5 версиями Haiku и Opus

Особенно заметны улучшения в понимании контекста, юмора и сложных инструкций, а также в создании контента с естественным слогом. Нейросеть успешно справилась с 64% задач по программированию, тогда как предыдущая версия – Claude 3 Opus – решила лишь 38%.

Artifacts в Claude 3.5 Sonnet
Artifacts в Claude 3.5 Sonnet

Вместе с обновлением модели состоялся релиз новой функции – Artifacts. Теперь Claude может в соседнем окне создавать динамичные объекты: сайты, симуляции законов физики, анимацию, диаграммы, svg и др. Функция Artifacts активируется автоматически.

Теперь в ответ на условный запрос «сделай сайт» чат будет делиться на две части. Слева продолжится диалог с Claude, где можно попросить увеличить кнопку или сменить шрифт. В правой – отобразится готовый макет сайта, над которым ведется работа.

29 августа 2024 года Anthropic объявила, что Artifacts теперь доступны всем пользователям Claude AI, даже по бесплатной подписке.

Новинка также доступна и для внедрения сторонними разработчиками – можно получить claude 3.5 sonnet api key в консоли Anthropic. Пошагово процесс описываем в последнем разделе статьи.

Сравнение бенчмарков Claude, ChatGPT и Gemini

Бенчмарки Claude AI в сравнении с GPT-4o
Бенчмарки Claude AI в сравнении с GPT-4o

Лидерство в рейтинге ИИ-моделей удерживают:

  • GPT-4o.
  • Claude 3.5 Sonnet.
  • Gemini 1.5 Pro Advanced.

Claude 3.5 Sonnet превосходит Claude 3 Opus по всем бенчмаркам. Улучшения наиболее заметны для задач, требующих визуального мышления. Claude 3.5 Sonnet точнее распознает текст на размытых изображениях, извлекает максимум информации со схем и диаграмм.

Языковая модель Anthropic по результатам тестов лидирует в программировании, особенно в создании графических интерфейсов. Claude 3.5 Sonnet значительно превосходит GPT-4o, Gemini 1.5 по скорости генерации кода и текста. В логических задачах модели показали сопоставимые результаты. GPT-4o удерживает первое место в решении сложных математических задач за счет более точных результатов и лучшего форматирования формул.

Как пользоваться Claude, находясь в РФ?

Claude в России заблокирован
Бенчмарки Claude AI в сравнении с GPT-4o

Как зарегистрироваться в Claude? Сервисы Anthropic доступны в 159 странах. Россия в их список не входит. Для использования Claude в РФ требуется сменить российский IP-адрес на иностранный, получить телефонный номер разрешенной страны и пройти регистрацию через e-mail или Google.

Какие сложности тут могут возникнуть?

  • Anthropic часто блокирует аккаунты Claude даже после смены региона. Приходится повторно искать иностранные номера и сервисы переключения IP для обхода ограничений.
  • Нужно выполнить определенный набор действий, чтобы приобрести номер телефона другой страны.
  • Аккаунт могут заблокировать, если выполнять вход из разных стран.
  • Регистрация через Google возможна только на английском языке.

Как пользоваться Claude напрямую из РФ?

Самый доступный способ пользоваться Claude в России – найти удобную платформу-агрегатор. Такую, как онлайн-сервис Mitup AI. На сайте представлены все самые популярные нейросети: ChatGPT, Gemini и LLaMa. Чтобы пользоваться чат-ботами напрямую из РФ и без сложностей, которые мы описали выше, нужно только выполнить простую регистрацию через свой e-mail. Также в Mitup AI доступны 3 бесплатные генерации в день для неавторизованных пользователей.

Где получить Claude API для разработки?

Стоимость Claude AI API
Стоимость Claude AI API

Anthropic предоставляет доступ к своим языковым моделям через API, то есть позволяет “скачать” Claude. Разработчики могут получить Claude AI API key и внедрять нейросеть в свои приложения, не ограничиваясь окном браузера.

Чтобы получить доступ к Claude 3 API и Claude 3.5 API:

  1. Смените страну подключения.
  2. Перейдите в панель для разработчиков.
  3. Введите e-mail компании или войдите через Google.
  4. Введите имя и подтвердите совершеннолетие.
  5. Укажите название организации, область работы, ссылку на корпоративный сайт.
  6. В консоли найдите раздел «Get API keys», создайте и скопируйте первый Claude API key.

Стандартный тарифный план имеет ограничение 4,000 запросов в минуту. Актуальные цены за генерации моделей Claude 2.0-3.5 можно посмотреть на официальном сайте. Если планируется нагрузка посерьезнее, выбирайте кастомный тариф с ежемесячной оплатой и поддержкой от Anthropic.

Несмотря на географические ограничения, пользователи из РФ могут получить доступ к флагманским нейросетям, используя российские онлайн-сервисы и методы обхода блокировок. По мере развития и совершенствования Claude, можно ожидать, что модели Anthropic станут одним из ключевых инструментов в области ИИ и продолжат открывать новые возможности для бизнеса, науки и творчества.