Google только что продемонстрировал мощное новое обновление для Gemini.

neto

Если кажется, что Google засыпает нас объявлениями о Гемини, то это потому, что они так и делают. На прошлой неделе компания переименовала своего бота искусственного интеллекта, Барда, в Гемини, и представила Гемини Advanced, свой первый платный уровень подписки на искусственный интеллект. Свежие новости о Гемини 1.5, следующей версии модели искусственного интеллекта Google, уже на подходе.

Что такое Gemini 1.5?

Гугл говорит, что Gemini 1.5 построен на архитектуре Трансформера и Смеси Экспертов (MoE). По сравнению с традиционной архитектурой Трансформера, которая по сути является одной большой нейронной сетью, Гугл говорит, что модели MoE могут быть разделены на несколько «экспертных» нейронных сетей. Таким образом, только те пути, которые необходимы для данной задачи, активируются в модели, что, по словам Гугла, намного эффективнее стандартной функции.

Первая версия Gemini 1.5, доступная для тестирования, — это Gemini 1.5 Pro. «Pro» — это название Google для его LLM (больших языковых моделей), которые лучше всего работают на самых разнообразных задачах и устройствах. Подумайте об этом как о GPT-3.5, модели, разработанной для использования в наиболее широком спектре приложений, а не наиболее мощных.

В то время как 1.5 Pro имеет стандартное окно контекста из 128 000 токенов (то же, что и у GPT-4), Google сообщает, что в настоящее время тестирует окно контекста до одного миллиона токенов, а также 10 миллионов, в сравнении с 32 000 у 1.0 Pro. Чем больше токенов может обрабатывать модель, тем больше может быть ваш промпт, и, следовательно, тем больше запросов модель может обрабатывать одновременно. Согласно Google, 1.5 Pro может обрабатывать до одного часа видео, 11 часов аудио и кодовые базы с более чем 30 000 строк кода (или более 700 000 слов) одновременно. (Она также может обрабатывать одиночные запросы с более чем 100 000 строк кода.)

1.5 Pro, по сообщениям, лучше понимает большие объемы информации и способен отвечать на сложные и конкретные вопросы о ней. В демонстрационном видео Google показывает пример того, как 1.5 Pro обрабатывает 402-страничные транскрипты миссии Аполлона 11. Затем она показывает набросок ботинка, с указанием стрелкой на землю, и спрашивает модель, о чем изображение. Модель смогла определить, что этот набросок изображает момент, когда Нил Армстронг ступил на Луну, и произнес свою знаменитую цитату, все это только по рисунку. Она также может анализировать контент, например, немой фильм, описывать происходящее и выделять маленькие моменты, которые большинство зрителей могут пропустить.

Google говорит, что 1.5 Pro превосходит 1.0 Pro на 87% из используемых тестовых показателей. Он также выполняет «на широко сходном уровне» с 1.0 Ultra, моделью, управляющей Gemini Advanced. Компания также довольна своим «контекстным обучением», при котором модель может воспринимать информацию из своего текущего набора данных и применять ее в новых способах, не требуя дополнительных подсказок.

Как попробовать Gemini 1.5

Гугл проводит испытания для Gemini 1.5 Pro через AI Studio и Vertex AI и имеет список ожидания для заинтересованных разработчиков. Если вы действительно заинтересованный разработчик, вы можете зарегистрироваться в списке ожидания здесь.

Как только Gemini 1.5 станет широко доступным через сервисы Gemini от Google, вы сможете бесплатно использовать его окно на 125 000 токенов. Если вы хотите получить доступ к окну на один миллион токенов, это будет стоить вам денег. (В настоящее время цена неизвестна.)