
На прошедшей конференции WWDC24 Apple представила Apple Intelligence — новый набор функций искусственного интеллекта для iPhone, Mac и других устройств. После чего, на официальном сайте были опубликованы подробности об Apple Intelligence, включая две основные модели:
- Локальная модель: языковая модель с примерно 3 миллиардами параметров, работающая на устройстве и превосходящая по результатам тестов многие открытые модели с 7 миллиардами параметров, такие как Mistral-7B и Gemma-7B.
- Облачные модели: более крупные языковые модели, работающие через частные облака на серверах Apple.
Apple заявляет, что Apple Intelligence состоит из нескольких высокопроизводительных генеративных моделей, адаптированных для повседневных задач пользователей и способных динамически подстраиваться под их текущую деятельность. Эти модели могут писать и уточнять тексты, приоритизировать и обобщать уведомления, создавать интересные изображения для общения с семьей и друзьями, а также оптимизировать взаимодействие с приложениями.
Базовая модель Apple обучается на платформе AXLearn, проекте с открытым исходным кодом, представленном Apple в 2023 году. Она использует технологии JAX и XLA, что позволяет масштабировать обучение на различном оборудовании и облачных платформах, включая TPU и графические процессоры.
Apple обещает, что при обучении базовых моделей не будут использоваться личные данные пользователей. Компания применяет фильтры для удаления конфиденциальной информации, такой как номера социального страхования и кредитных карт, а также фильтрует ненормативную лексику и контент низкого качества. Кроме того, Apple выполняет извлечение данных, дедупликацию и применяет классификаторы для идентификации высококачественных материалов.
Для оптимизации Apple использует технологии внимания к групповым запросам как в локальных, так и в серверных моделях. Локальная модель имеет размер словаря 49 КБ, а серверная — 100 КБ, включая дополнительные языковые и технологические теги.
Apple утверждает, что благодаря оптимизации можно достичь задержки первого токена около 0,6 миллисекунды и скорости генерации 30 токенов в секунду на iPhone 15 Pro. В тесте оценки инструкций (IFEval) локальная модель Apple превзошла Phi-3-mini, Mistral-7B и Gemma-7B, а также не уступает DBRX-Instruct, Mixtral-8x22B и GPT-3.5-Turbo. Облачные модели сравнимы с GPT-4-Turbo.
Apple планирует открыть доступ к Apple Intelligence в бета-версиях iOS 18, iPadOS 18 и macOS Sequoia этим летом, а для широкой публики — осенью. Однако некоторые функции, поддержка дополнительных языков и платформ будут доступны только в следующем году.
Apple Intelligence будет бесплатной, но доступной только на устройствах с чипом A17 Pro или любым чипом M-серии. Это означает, что для использования функций потребуется iPhone 15 Pro, iPhone 15 Pro Max или будущие модели iPhone 16. Для Mac потребуется устройство с чипом M1 или выше, а для iPad — iPad Pro или iPad Air с чипом M1 или выше.