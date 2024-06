11 июня Центр исследований фундаментальных моделей (CRFM) Стэнфордского университета опубликовал исследование под названием «Массивный анализ многозадачных языковых моделей» (Massive Multitask Language Analysis). В этот список вошли десять лучших моделей по комплексному рейтингу, две из которых принадлежат китайским производителям: Qwen2 Instruct от компании Alibaba (72B) и Yi Large от Zero One Wish (превью).

Исследование Massive Multitask Language Analysis на платформе HELM основано на методе тестирования, предложенном Дэном Хендриксом и другими учёными, для оценки точности языковых моделей в условиях многозадачного обучения. Тест включает 57 задач по различным областям, включая базовую математику, историю США, информатику, юриспруденцию и другие дисциплины. Для успешного прохождения теста модель должна обладать широким кругозором и умением решать разнообразные задачи.

Рейтинг выглядит следующим образом:

Claude 3 Opus (Anthropic, США, инвестиции Amazon) GPT-4o (OpenAI, США) Gemini 1.5 Pro (Google, США) GPT-4 (0613 OpenAI, США) Qwen2 Instruct (72B, Alibaba, Китай) GPT-4 Turbo (OpenAI, США) Gemini 1.5 Pro (0409 Google, США) GPT-4 Turbo (1106 OpenAI, США) Llama 3 (Meta*, США) Yi Large (Zero One Wish, Китай)

Модель Qwen2 от Alibaba представляет собой открытую модель большого языка, выпущенную 6 июня текущего года. Она включает пять моделей предварительной подготовки и настройки инструкций различных масштабов, включая Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B и Qwen2-72B, поддерживающие 27 языков. Модели Qwen2-7B-Instruct и Qwen2-72B-Instruct, помимо английского и китайского, поддерживают данные обучения на нескольких языках с контекстами длиной до 128 000 токенов.

Модель Yi Large от Zero One Thing является закрытой. Она базируется на предварительно обученных языковых моделях 6B и 34B, которые затем расширены до моделей чата, моделей с длинным контекстом 200 тыс., моделей глубокого обновления и визуальных языковых моделей. По словам официального представителя, Yi Large превосходит ведущие модели, такие как GPT-4 и Claude 3 Opus, по ключевым показателям.

Источник — ithome.com

*Компания Meta признана экстремистской на территории Российской Федерации