Google выпускает олимпиаду, завоевавшую медаль Близнецов, 2,5 ‘глубиной, думайте,-публично-но есть улов …

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Google официально запустил Gemini 2.5 Deep Think, новую вариацию своей модели ИИ, разработанной для более глубоких рассуждений и сложного решения проблем, которая в прошлом месяце сделала заголовки для завоевания золотой медали на Международной математической олимпиаде (IMO)-впервые модель ИИ достигла подвига.

Однако, Это, к сожалению нет Идентичная модель золотой медали. На самом деле это менее мощная «бронза» версия в блоге Google и Logan Kilpatrick, лидерство продукта для Google AI Studio.

Как разместил Килпатрик в социальной сети x: «Это вариация нашей модели IMO Gold, которая быстрее и более оптимизирована для ежедневного использования. Мы также даем полную модель IMO Gold для набора математиков для проверки стоимости полных возможностей».

Теперь доступно через мобильное приложение GeminiЭта бронзовая модель доступна для подписчиков самого дорогого индивидуального плана ИИ Google, AI Ultra, который стоит 249,99 долл. США в месяц с 3-месячным стартовым продвижением по сокращению ставки в 124,99 долл. США в месяц для новых подписчиков.

Google также сказал в своем сообщении в блоге, что он принесет глубоко мысли с интеграцией использования инструментов для «доверенных тестеров» через интерфейс прикладного программирования Gemini (API) «в ближайшие недели».

Почему «глубокие мысли» настолько сильна

Gemini 2.5 Deep Think основан на семействе крупных языковых моделей Близнецов (LLMS), добавляя новые возможности, направленные на рассуждение с помощью сложных проблем.

Это Использует методы «параллельного мышления» для одновременного изучения нескольких идей и включает в себя обучение подкреплению для укрепления своей пошаговой способности решать проблемы с течением времени.

Модель есть Разработано для вариантов использования, которые выигрывают от расширенного обсуждения, таких как тестирование математических предположений, научные исследования, дизайн алгоритма, и творческие задачи итерации, такие как уточнение кода и дизайна.

Ранние тестеры, в том числе математики, такие как Мишель Ван Гаррел, использовали его для исследования нерешенных проблем и создания потенциальных доказательств.

Пользователь и эксперт ИИ власть Итан Моллик, профессор Школы бизнеса Уортон в Университете Пенсильвании, также опубликованный на X, что он мог привлечь внимание, которое он часто использует, чтобы проверить возможности новых моделей — «Создать то, что я могу вставить в P5J, что замагтело меня с его умностью в создании чего -то, что вызывает у групп управления в дикой будущей» и и в будущем превратил его в 3D -графику, которая впервые сделала любая модельПолем

Был ранний доступ к Близнецам с глубоким мышлением. Очень хорошая модель, большой прирост по сравнению с стандартным Gemini 2.5 Pro для многих проблем.

Вот первая попытка в подсказке управления Starship, которую я попробую с каждой моделью. В первый раз я увидел модель, создавая 3D -интерфейс в ответ. pic.twitter.com/blff2icop3
— Итан Моллик (@emollick) 1 августа 2025 года

Производительные показатели и варианты использования

Google выделяет несколько ключевых областей применения для глубокого размышления:

Математика и наука: Модель может имитировать рассуждение для сложных доказательств, изучить предположения и интерпретировать плотную научную литературу
Кодирование и дизайн алгоритма: Он хорошо выполняет задачи, включающие компромиссы эффективности, сложность времени и многоэтапную логику
Творческое развитие: В сценариях дизайна, таких как создание Voxel Art или пользовательское интерфейс, Deep Think демонстрирует более сильное итерационное улучшение и улучшение деталей

Модель также Выводит производительность в эталонных оценках, таких как LiveCodebench V6 (для способности кодирования) и последний экзамен человечества (охватывая математику, науку и рассуждения).

Это OutScored Gemini 2.5 Pro и конкурирующие модели, такие как GPT-4 и Xai’s Grok 4 с двузначными маржа по некоторым категориям (рассуждения и знания, генерация кода и математика IMO 2025).

Gemini 2.5 Deep Think vs. Gemini 2.5 Pro

В то время как Deep Think и Gemini 2.5 Pro являются частью семейства моделей Gemini 2.5, Google Deep Deep Think как более способный и аналитически квалифицированный вариантособенно когда дело доходит до сложных рассуждений и многоэтапного решения проблем.

Это улучшение связано с использованием параллельное мышление и Подкрепление методов обучениякоторые позволяют модели моделировать более глубокое когнитивное обсуждение.

В своем официальном общении Google описывает глубокие думать как лучше в Обработка нюансированных подсказок, изучение нескольких гипотез и создание более утонченных результатовПолем Это подтверждается бок о бок сравнения в генерации воксель, где Deep Think добавляет больше текстуры, структурной верности и составного разнообразия, чем 2,5 Pro.

Улучшения не просто визуальные или анекдотичные. Google сообщает, что глубоко думайте Overperforms Gemini 2.5 Pro по нескольким техническим показателям Связано с рассуждением, генерацией кода и междоменной экспертизой. Тем не менее, эти выгоды сопровождаются компромиссами в отзывчивости и быстрое принятие.

Вот срыв:

Способность / атрибут	Близнецы 2.5 Pro	Gemini 2,5 Deep Think
Скорость вывода	Быстрее, низкая задержка	Медленнее, расширенное «время мышления»
Сложность рассуждений	Умеренный	Высокий — использует параллельное мышление
Быстрое глубина и творчество	Хороший	Более подробный и нюансированный
Эталонная производительность	Сильный	Уровень развития
Объективность безопасности контента и тона	Улучшен по сравнению с более старыми моделями	Дальнейшее улучшение
Уровень отказа (доброкачественные подсказки)	Ниже	Выше
Длина вывода	Стандартный	Поддерживает более длительные ответы
Воксель искусство / дизайн.	Основная структура сцены	Улучшенные детали и богатство

Google отмечает, что Более высокий уровень отказа это область активного расследования. Это может ограничить его гибкость при обработке неоднозначных или неформальных запросов по сравнению с 2,5 Pro. В отличие от этого, 2.5 Pro остается лучше подходящим для пользователей, которые расставляют приоритеты скорость и отзывчивостьособенно для более легких, общих задач.

Эта дифференциация позволяет пользователям выбирать на основе их приоритетов: 2.5 Pro для скорости и плавностиили Глубокий думайте о строгости и размышленииПолем

Не модель выигрышной золотой медали, просто бронза

В июле Google DeepMind попала в заголовки газет, когда более продвинутая версия модели Gemini Deep Think достигла официального статуса золота в 2025 году-самого престижного конкурса математики в мире для учащихся старших классов.

Система Решены пять из шести сложных проблем и стали первым ИИ, получившим результат на уровне золота от IMO.

Демис Хассабис, генеральный директор Google DeepMind, объявил о достижении в X, заявив, что модель решила проблемы с сквозными на естественном языке-без необходимости перевода в формальный синтаксис программирования.

Плата IMO подтвердила, что модель набрала 35 из возможных 42 очков, намного выше золотого порога. Gemini 2,5 Deep Think решения были Описано президентом конкуренции Грегором Долинаром как ясно, точно и во многих случаях, Легче следовать, чем у людей -конкурентов.

Тем не менее, Gemini 2.5 Deep Think, выпущенный для пользователей, — это не та же модель конкуренции, скорее, более низкая, но, по -видимому, быстрее.

Как получить доступ к глубокому, думайте сейчас

Gemini 2,5 Deep Think — это Доступно исключительно в мобильном приложении Google Gemini для iOS и Android в настоящее время для пользователей на Google Ai Ultra Planчасть линейки подписки Google One, с ценой следующим образом.

Рекламное предложение: $ 124,99 в месяц в течение 3 месяцев, затем он поднимается до…
Стандартная ставка: $ 249,99/месяц
Включены функции: 30 ТБ хранилища, доступ к приложению Gemini с глубоким Think и Veo 3, а также такие инструменты, как Flow, Web и 12 500 ежемесячных кредитов AI

Подписчики могут активировать Deep Think в приложении Gemini, выбрав модель 2.5 Pro и переключая опцию «глубокие мышления».

Он поддерживает фиксированное количество подсказок в день и интегрируется с такими возможностями, как выполнение кода и поиск Google. Модель также генерирует более длинные и более подробные выходы по сравнению со стандартными версиями.

План Google AI Pro с более низким уровнем по цене 19,99 долл. США в месяц (с бесплатным испытанием), не включает доступ к глубокому мышлению, а также бесплатно Служба ИИ Близнецов.

Почему это имеет значение для технических лиц, принимающих предприятие

Gemini 2.5 Deep Think представляет собой практическое применение основного этапа исследования.

Это Позволяет предприятиям и организациям использовать математическую олимпиадную модель, завоевавшую медали, и присоединиться к их сотрудникам, хотя сейчас только через отдельную учетную запись пользователя сейчас.

Для исследователей, получающих полную модель IMO-Grade, она дает представление о будущем совместного искусственного интеллекта по математике. Для подписчиков Ultra Deep Think обеспечивает мощный шаг к более способной и контекстной помощи ИИ, который сейчас работает на ладони.

Источник

Почему «глубокие мысли» настолько сильна

Производительные показатели и варианты использования

Gemini 2.5 Deep Think vs. Gemini 2.5 Pro

Не модель выигрышной золотой медали, просто бронза

Как получить доступ к глубокому, думайте сейчас

Почему это имеет значение для технических лиц, принимающих предприятие

Фестиваль «Одна шестая» объявляет набор в сценарную и актерскую лаборатории

Почему ИИ с открытым исходным кодом стал американским национальным приоритетом

Рекомендуем

Оставить комментарий Отменить ответ