Интернет-магазин DONTA

Исследователи Apple работают над MM1, семейством мультимодальных моделей искусственного интеллекта с 30 миллиардами параметров

Исследователи Apple заявили, что модели ИИ MM1 в настоящее время находятся на этапе предварительного обучения.

Исследователи Apple работают над MM1, семейством мультимодальных моделей искусственного интеллекта с 30 миллиардами параметров

Исследователи Apple заявили, что модель MM1 состоит как из плотных моделей, так и из вариантов MoE

Реклама

Исследователи Apple поделились своей работой по созданию модели большого языка (LLM) мультимодального искусственного интеллекта (ИИ) в предварительном издании. В документе, опубликованном на онлайн-портале 14 марта, рассказывается, как удалось реализовать расширенные возможности мультимодальности и заставить базовую модель обучаться как на текстовых данных, так и на изображениях. Новые достижения в области искусственного интеллекта для технологического гиганта из Купертино появились после замечаний генерального директора Тима Кука, сделанных во время телеконференций компании, где он сказал, что функции искусственного интеллекта могут появиться позже в этом году.

Препринтная версия исследовательской работы была опубликована на arXiv, онлайн-хранилище научных работ с открытым доступом. Однако публикуемые здесь статьи не рецензируются. Хотя в самой статье Apple не упоминается, большинство упомянутых исследователей связаны с подразделением машинного обучения (ML) компании, что позволяет предположить, что проект также связан с производителем iPhone.

По словам исследователей, они работают над MM1, семейством мультимодальных моделей, содержащих до 30 миллиардов параметров. Назвав его «эффективным мультимодальным LLM (MLLM), авторы статьи подчеркнули, что кодеры изображений, соединитель языка видения и другие компоненты архитектуры и выбор данных были сделаны для создания модели ИИ, которая способна понимать как текст, так и текст. входные данные на основе изображений.

Приводя пример, в документе говорится: «Мы демонстрируем, что для крупномасштабного мультимодального предварительного обучения с использованием тщательного сочетания подписи к изображению, чередующегося текста изображения и только текста данные имеют решающее значение для достижения самых современных (SOTA) результатов нескольких тестов в нескольких тестах по сравнению с другими опубликованными результатами предварительного обучения».

Если разобраться, модель ИИ в настоящее время находится на этапе предварительного обучения, а это означает, что она недостаточно обучена, чтобы давать желаемые результаты. Это этап, когда алгоритм и архитектура ИИ используются для разработки рабочего процесса модели и того, как она в конечном итоге обрабатывает данные. Команда исследователей Apple смогла добавить к модели компьютерное зрение с помощью кодировщиков изображений и соединителя языка видения. Затем, при тестировании с использованием только изображений, изображений и текста, а также набора только текстовых данных, команда обнаружила, что результаты были конкурентоспособными по сравнению с существующими моделями на том же этапе.

Хоть прорыв и есть Важно отметить, что этой исследовательской работы недостаточно, чтобы убедиться в том, что мультимодальный чат-бот с искусственным интеллектом будет добавлен в операционную систему Apple. На данном этапе трудно даже сказать, является ли модель ИИ мультимодальной при приеме входных данных или при выдаче выходных данных (может ли она генерировать изображения ИИ или нет). Но если после экспертной оценки результаты подтвердятся, можно сказать, что технологический гигант сделал еще один большой шаг на пути к созданию собственной базовой модели генеративного искусственного интеллекта.

Является ли Samsung Galaxy Z Flip 5 лучшим решением? лучший складной телефон, который вы можете купить в Индии прямо сейчас? Мы обсуждаем новый складной телефон компании в форме раскладушки в последнем выпуске подкаста Orbital, подкаста Gadgets 360. Orbital доступен на Spotify, Gaana, JioSaavn, Google Podcasts, Apple Podcasts, Amazon Music и везде, где вы получаете свои подкасты.
Партнерские ссылки могут создаваться автоматически — подробности см. в нашем этическом заявлении.