AnnieBronson Dec 6 2023 at 21:53

Google представила ИИ-модель Gemini, которая обходит GPT-4 в большинстве тестов

2 min

42K

Machine learning*Cloud services*Artificial Intelligence

Google объявила о запуске главного конкурента ChatGPT — ИИ-модели Gemini, которая обходит GPT-4 в большинстве тестов. По словам гендиректора компании Сундара Пичаи, Gemini — это огромный шаг вперёд в развитии ИИ, который в конечном итоге повлияет практически на все продукты Google. Модель способна на «продвинутые рассуждения» в нескольких форматах и появится в открытом доступе 13 декабря.

Сундар Пичаи анонсировал выход Gemini на конференции I/O в июне. Сейчас под именем Gemini Google выпустила сразу несколько ИИ-моделей. Так, «лёгкая» Gemini Nano предназначена для работы на устройствах Android. Модель Gemini Pro вскоре станет основой многих сервисов Google, и в первую очередь чат-бота Bard. Самую мощную модель, Gemini Ultra, разработчики называют крупнейшей LLM, которую когда-либо выпускала Google. Она, по всей видимости, предназначена для центров обработки данных и корпоративных приложений.

Gemini, Pro и Nano выйдут в среду, 13 декабря. Доступ к модели Pro можно будет получить через чат-бота Bard, а для разработчиков и корпоративных клиентов доступ будет открыт через Google Generative AI Studio или Vertex AI в Google Cloud. Стоит отметить, что версия Bard на базе Pro пока не выйдет в Великобритании и Швейцарии из-за задержек в согласовании релиза с местными регуляторами. Что касается версии Ultra, то она ещё тестируется и увидит свет только в 2024 году. Известно, что её интегрируют в продвинутую версию Bard под названием Bard Advanced.

Gemini пока доступна только на английском языке, однако скоро будет поддерживать и другие. Как утверждает Сундар Пичаи, эта модель в конечном итоге будет интегрирована в поисковую систему Google, её рекламные продукты, браузер Chrome и другие приложения.

Gemini — мультимодальная модель, она способна воспринимать текст, аудио, изображения, видео и код. Компания уже протестировала Gemini в сравнении с GPT-4, которая лежит в основе чат-бота ChatGPT от OpenAI. В Google заявили, что Ultra превзошла GPT-4 в 30 из 32 тестов производительности, в том числе в рассуждении и распознавании изображений. Модель Pro превзошла GPT-3.5 в шести из восьми тестов.

Google также заявила, что Ultra стала первой ИИ-моделью, которая превзошла людей в многозадачном тесте под названием MMLU, который охватывает 57 предметов, включая математику, физику, право, медицину и этику. Ultra будет использоваться в новом инструменте для написания кода под названием AlphaCode2, который, по утверждению Google, способен в тестах превзойти 85% программистов-людей.

Как заявляют разработчики, самое явное преимущество Gemini заключается в её мультимодальности. Google не обучала отдельные модели для распознавания голоса и изображений, такие как DALL-E и Whisper от OpenAI, а с самого начала строила одну модель, способную воспринимать разные виды информации. И в Google обещают, что это восприятие будет только улучшаться.

«Есть ещё такие вещи, как действие и прикосновение, что уже больше относится к области робототехники, — заявляет генеральный директор DeepMind Демис Хассабис. По его словам, со временем Gemini получит больше «чувств», станет осознаннее и точнее. — Эти модели просто лучше понимают окружающий мир».

Tags:

Hubs: