Нарратив NVIDIA «Фабрика Ай» сталкивается с проверкой реальности, так как войны с выводами раскрывают 70% маржи

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

Перчатки вышли на Во вторник в VB Transform 2025 в качестве альтернативных производителей чипов непосредственно оспаривали повествование о доминировании NVIDIA во время панели о выводе, выявляя фундаментальное противоречие: как можно сделать вывод искусственного интеллекта Коммодитизированная «фабрика» и командование 70% валовой маржи?

Джонатан Росс, генеральный директор Groq, не разбивал слова, обсуждая тщательно продуманные сообщения Nvidia. «AI Factory — это всего лишь маркетинговый способ сделать AI звучать менее страшным», — сказал Росс во время панели. Шон Лож, технический директор Cerebras, конкурент, был одинаково прямым: «Я не думаю, что Nvidia Minds, имеющие всех поставщиков услуг, сражающихся с этим за каждую последнюю копейку, пока они сидят там с 70 очками».

На карту поставлены сотни миллиардов инвестиций в инфраструктуру и будущей архитектуры искусственного искусства предприятий. Для лидеров CISO и искусственного интеллекта в настоящее время заперты в еженедельных переговорах с OpenAI и другими поставщиками для большей способности, группа разоблачила неудобные истины о том, почему их инициативы по ИИ продолжают бить на контрольно -пропускных пунктах.

>> Смотрите все наше преобразование 2025 года здесь <<

Кризис потенциала, о котором никто не говорит

«Любой, кто на самом деле является большим пользователем этих моделей ИИ Gen, знает, что вы можете пойти в Openai, или кто бы он ни был, и они на самом деле не смогут обслуживать вас достаточно токенов», — объяснил Дилан Патель, основатель полуанализа. Существуют еженедельные встречи между некоторыми из крупнейших пользователей ИИ и их поставщиками моделей, чтобы попытаться убедить их выделить больше возможностей. Затем есть еженедельные встречи между этими поставщиками моделей и их поставщиками оборудования ».

Участники панели также указали на нехватку токена как разоблачение фундаментального недостатка в аналогии за фабрики. Традиционное производство реагирует на сигналы спроса, добавляя мощность. Однако, когда предприятия требуют в 10 раз больше емкости вывода, они обнаруживают, что цепочка поставок не может сгибаться. GPU требуют двухлетнего времени выполнения. Центры обработки данных нуждаются в разрешениях и договорах питания. Инфраструктура не была построена для экспоненциального масштабирования, что заставило поставщиков доступа к рациону через пределы API.

По словам Пателя, Антропик подскочил с 2 до 3 миллиардов долларов за ARR всего за шесть месяцев. Курсор перешел с нуля до 500 миллионов долларов США. Openai перешел 10 миллиардов долларов. И все же предприятия все еще не могут получить токены, которые им нужны.

Почему мышление «фабрика» нарушает экономику искусственного интеллекта

Концепция «Фабрика ИИ» Дженсена Хуанга подразумевает стандартизацию, коммодитизацию и повышение эффективности, что снижает затраты. Но панель показала три фундаментальных способа, которые эта метафора разрушается:

Во -первых, вывод не является единым. «Даже сегодня, для вывода, скажем, DeepSeek, есть ряд поставщиков по кривой того, как быстро они предоставляют, какая стоимость», — отметил Патель. DeepSeek обслуживает свою собственную модель по самой низкой стоимости, но обеспечивает только 20 токенов в секунду. «Никто не хочет использовать модель в 20 токенах в секунду. Я говорю быстрее 20 токенов в секунду».

Во -вторых, качество сильно варьируется. Росс провел историческую параллель со стандартным нефтью: «Когда началось стандартное нефть, нефть имела различное качество. Вы можете купить нефть у одного поставщика, и это может поджечь ваш дом». Сегодняшний рынок выводов искусственного интеллекта сталкивается с аналогичными различиями в качестве, поскольку поставщики используют различные методы, чтобы снизить затраты, которые непреднамеренно ставят под угрозу качество выпуска.

В -третьих, и наиболее критически, экономика перевернута. «Одна из вещей, которая необычна в ИИ, это то, что вы не можете тратить больше, чтобы получить лучшие результаты», — объяснил Росс. «Вы не можете просто иметь программное приложение, скажем, я собираюсь потратить вдвое больше на размещение своего программного обеспечения, и приложения могут стать лучше».

Как подход одного провайдера привлек внимание мета

Когда Росс упомянул, что Марк Цукерберг похвалил Грока за то, что он «единственный, кто запустил его с полным качеством», он непреднамеренно раскрыл качественный кризис отрасли. Это было не просто признание. Это было обвинение любого другого провайдера, разрезающего углы.

Росс изложил механику: «Многие люди делают много хитростей, чтобы снизить качество, не намеренно, а для снижения своей стоимости, улучшить свою скорость». Методы звучат технические, но влияние просто. Квантование снижает точность. Обрезка удаляет параметры. Каждая оптимизация снижает производительность модели так, как предприятия не могут обнаружить до тех пор, пока производство не пройдет.

Стандартная нефтяная параллель Росс Дрю освещает ставки. Сегодняшний рынок выводов сталкивается с той же проблемой качества. Поставщики делают ставку на то, что предприятия не заметят разницы между точностью 95% и 100%, что ставит ставки против таких компаний, как Meta, которые имеют сложность для измерения деградации.

Это создает немедленные императивы для покупателей предприятий.

Установить качественные показатели перед выбором поставщиков.
Аудит существующих партнеров по выводу для нераскрытых оптимизаций.
Примите, что ценообразование премиум -класса для полной модели Fidelity в настоящее время является постоянной рыночной функцией. Эпоха предположения о функциональной эквивалентности между поставщиками выводов закончилась, когда Цукерберг вызвал разницу.

Пратокс токенов в размере 1 миллиона долларов США

Самый показательный момент наступил, когда группа обсуждала цены. Ложь подчеркнула неудобную правду для отрасли: «Если эти миллионы жетонов столь же ценны, насколько мы считаем, верно? Это не о движущихся словах. Вы не взимаете 1 доллар за движущиеся слова. Я плачу своему адвокату 800 долларов за час, чтобы написать двухстраничную память».

Это наблюдение сокращается до сердца проблемы с обнаружением цены ИИ. Индустрия участвует в гонках, чтобы привести к затратам на токен ниже 1,50 долл. США за миллион, в то время как эти токены будут трансформировать все аспекты бизнеса. Панель неявно согласилась друг с другом, что математика не складывается.

«Практически все тратят, как и все эти быстрорастущие стартапы, сумма, которую они тратят на токены, поскольку услуга почти соответствует их доходам один к одному»,-сказал Росс. Этот коэффициент расходов 1: 1 на токены искусственного интеллекта по сравнению с доходом представляет собой неустойчивую бизнес -модель, которую участники группы утверждают, что «фабричный» повествование удобно игнорирует.

Производительность меняет все

Cerebras и Groq не просто конкурируют по цене; Они также конкурируют за производительность. Они принципиально меняют то, что возможно с точки зрения скорости вывода. «Благодаря технологии масштаба пластин, которую мы создали, мы включаем 10 раз, иногда в 50 раз, более высокую производительность, чем даже самые быстрые графические процессоры сегодня», — сказал Лей.

Это не постепенное улучшение. Это обеспечивает совершенно новые варианты использования. «У нас есть клиенты, у которых есть агентские рабочие процессы, которые могут занять 40 минут, и они хотят, чтобы эти вещи работали в режиме реального времени», — объяснила Ли. «Эти вещи просто невозможны, даже если вы готовы заплатить лучшие доллары».

Дифференциал скорости создает раздвоенный рынок, который не поддается стандартизации фабрики. Предприятия, нуждающиеся в выводе в реальном времени для приложений, ориентированных на клиента, не могут использовать ту же инфраструктуру, что и те, которые работают в течение ночи.

Настоящее узкое место: центры питания и обработки данных

В то время как все сосредотачиваются на поставке чипов, панель выявила фактическое развертывание AI -ограничения. «Возможность центра обработки данных — большая проблема. Вы не можете найти пространство центра обработки данных в США», — сказал Патель. «Сила — большая проблема».

Проблема инфраструктуры выходит за рамки производства чипов до фундаментальных ограничений ресурсов. Как объяснил Патель, «TSMC на Тайване может заработать чипсы на сумму более 200 миллионов долларов, верно? Это даже не… это скорость, с которой они масштабируют, смешно».

Но производство чипов ничего не означает без инфраструктуры. «Причина, по которой мы видим эти большие сделки на Ближнем Востоке, и отчасти почему обе эти компании имеют большое присутствие на Ближнем Востоке, это сила», — заявил Патель. В глобальной схватке на Compute предприятия «проходят по всему миру, чтобы получить место, где существует власть, где бы ни существовала мощность центров обработки данных, где бы ни находились электрики, которые могут построить эти электрические системы».

Google «Успешная катастрофа» становится реальностью каждого

Росс поделился свидетельским анекдотом из истории Google: «В Google в Google был очень популярен термин, который стал очень популярным в Google, называемом успешным катастрофой. Некоторые из команд создали приложения ИИ, которые начали работать лучше, чем люди впервые, и спрос на вычисление было настолько высоким, что им нужно было быстро удвоить или утроить мировой центр обработки данных».

Этот шаблон теперь повторяется по всему развертыванию ИИ предприятия. Приложения либо не могут получить тягу, либо испытать рост хоккейных палочек, который сразу же достигает лимитов инфраструктуры. Там нет среднего уровня, без плавной кривой масштабирования, которую предсказала бы фабричная экономика.

Что это значит для стратегии ИИ предприятия

Для ИТ -директоров, CISOS и лидеров искусственного интеллекта, откровения Группы требуют стратегической перекалибровки:

Планирование пропускной способности требует новых моделей. Традиционное ИТ -прогнозирование предполагает линейный рост. Рабочие нагрузки ИИ нарушают это предположение. Когда успешные приложения увеличивают потребление токенов на 30% в месяц, годовые планы мощности устарели в течение кварталов. Предприятия должны перейти от статических циклов закупок к динамическому управлению потенциалами. Создать контракты с продовольственными положениями. Мониторинг использования еженедельно, а не ежеквартально. Примите, что паттерны масштабирования ИИ напоминают кривые вирусных кривых, а не традиционные развертывания программного обеспечения для предприятия.

Скоровые премии постоянны. Идея о том, что вывод будет коммодитизировать в равномерные цены, игнорирует массовые пробелы в результате производительности между поставщиками. Предприятия должны бюджет на скорость, где это важно.

Архитектура превосходит оптимизацию. Groq и Cerebras не выигрывают, делая графические процессоры лучше. Они выигрывают, переосмысливая фундаментальную архитектуру AI Compute. Предприятия, которые ставят все на инфраструктуру на основе графических процессоров, могут оказаться застрявшими в медленной полосе.

Силовая инфраструктура является стратегической. Ограничение — это не фишки или программное обеспечение, а киловатт и охлаждение. Умные предприятия уже блокируют мощность и пространство центра обработки данных на 2026 год и далее.

Инфраструктурная реальность предприятия не могут игнорировать

Группа раскрыла фундаментальную истину: метафора фабрики ИИ не только неправильная, но и опасная. Стратегии построения предприятий, связанные с ценообразованием на товарные выводы и стандартизированную доставку, планируют рынок, который не существует.

Настоящий рынок работает на трех жестоких реалиях.

Нехватка емкости создает инверсию власти, где поставщики диктуют термины, а предприятия просят распределения.
Разница в качестве, разница между точностью 95% и 100%, определяет, превышают ли ваши приложения для искусственного интеллекта или катастрофически терпеть неудачу.
Инфраструктурные ограничения, а не технологии, устанавливают ограничения связывания на трансформацию ИИ.

Путь вперед для CISOS и лидеров искусственного интеллекта требует полностью отказаться от завода. Заблокировать мощность сейчас. Поставщики вывода аудита для скрытого деградации качества. Построить отношения поставщиков на основе архитектурных преимуществ, а не маргинальных затрат. Наиболее критически, признайте, что платить 70% маржи за надежный, высококачественный вывод может быть вашим самым умным инвестициями.

Альтернативные производители чипов в Transform не просто бросили вызов повествованию Nvidia. Они сообщили, что предприятия сталкиваются с выбором: заплатить за качество и производительность или присоединиться к еженедельным переговорам. Консенсус панели был ясен: успех требует сопоставления конкретных рабочих нагрузок с соответствующей инфраструктурой, а не для выполнения единых решений.

Источник

Кризис потенциала, о котором никто не говорит

Почему мышление «фабрика» нарушает экономику искусственного интеллекта

Как подход одного провайдера привлек внимание мета

Пратокс токенов в размере 1 миллиона долларов США

Производительность меняет все

Настоящее узкое место: центры питания и обработки данных

Google «Успешная катастрофа» становится реальностью каждого

Что это значит для стратегии ИИ предприятия

Инфраструктурная реальность предприятия не могут игнорировать

Предприятия должны переосмыслить IAM в качестве агентов AI по численности численности людей 10-1

IBM видит, что корпоративные клиенты используют «все», когда дело доходит до ИИ, задача состоит в том, чтобы соответствовать LLM с вариантом использования.

Рекомендуем

Оставить комментарий Отменить ответ