Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше
Многие усилия по развитию агента AI Enterprise никогда не попадают в производство, и это не потому, что технология не готова. Проблема, согласно DataBricks, заключается в том, что компании все еще полагаются на ручные оценки с процессом, который медленный, непоследовательный и трудный для масштабирования.
Сегодня на саммите Data + AI DataBricks запустил кирпичи мозаики в качестве решения этой проблемы. Технология основывается и расширяет платформу агента Mosaic AI, которую компания объявила в 2024 году. Проще говоря, она больше не достаточно хороша, чтобы просто иметь возможность создавать агентов ИИ, чтобы оказать реальное влияние.
Платформа Mosaic Agent Bricks автоматизирует оптимизацию агента, используя серию исследовательских инноваций. Среди ключевых инноваций-интеграция TAO (адаптивная оптимизация времени теста), которая обеспечивает новый подход к настройке искусственного интеллекта без необходимости маркированных данных. Mosaic Agent Bricks также генерирует специфичные для домена синтетические данные, создает контрольные показатели, соответствующие задачам, и оптимизирует баланс к качеству до затрат без ручного вмешательства.
По сути, цель новой платформы — решить проблему, которую пользователи DataBricks имели с существующими усилиями по разработке агентов искусственного интеллекта.
«Они летали слепыми, у них не было возможности оценить этих агентов», — сказал VentureBeat Хэнлин Тан, главный технологический директор DataBricks в нейронных сетях. «Большинство из них полагались на своего рода ручное, ручное отслеживание атмосферов, чтобы увидеть, звучит ли агент достаточно хорошо, но это не дает им уверенности в том, чтобы пойти в производство».
От исследовательских инноваций до производства искусственного искусства предприятия
Ранее Тан был соучредителем и техническим директором Mosaic, который был приобретен DataBricks в 2023 году за 1,3 миллиарда долларов.
В Mosaic большая часть исследовательских инноваций не обязательно оказала непосредственное воздействие на предприятие. Все изменилось после приобретения.
«Большой момент лампочки для меня был, когда мы впервые запустили наш продукт на DataBricks, и мгновенно, в одночасье, мы, как и тысячи корпоративных клиентов, использовали его», — сказал Тан.
В отличие от этого, до приобретения Mosaic потратила месяцы, пытаясь получить лишь несколько предприятий, чтобы попробовать продукты. Интеграция Mosaic в DataBricks дала исследовательской группе Mosaic прямой доступ к проблемам предприятия в масштабе и выявила новые области для изучения.
Этот контакт с предприятием выявил новые возможности исследования.
«Только тогда, когда у вас есть контакт с корпоративными клиентами, вы работаете с ними глубоко, вы на самом деле раскрываете некоторые интересные проблемы исследования, которые должны решить», — объяснил Тан. «Агент кирпичи…. В некотором смысле, в некотором роде эволюцию всего, над чем мы работаем в Mosaic, теперь, когда мы все полностью, полностью кирпичные компании».
Решение кризиса оценки агента
Команды предприятия сталкиваются с дорогостоящим процессом оптимизации проб и ошибок. Без контрольных показателей, ориентированных на задачу, или тестовых данных, специфичных для домена, каждая корректировка агента становится дорогой игрой в догадки. Следуют качественные дрейф, перерасход затрат и пропущенные сроки.
Agent Bricks автоматизирует весь конвейер оптимизации. Платформа принимает описание задачи высокого уровня и корпоративные данные. Он обрабатывает остальные автоматически.
Во-первых, он генерирует конкретные оценки и судьи LLM. Затем он создает синтетические данные, которые отражают данные клиента. Наконец, он ищет по методам оптимизации, чтобы найти лучшую конфигурацию.
«Клиент описывает проблему на высоком уровне, и они не входят в детали низкого уровня, потому что мы заботимся о них», — сказал Тан. «Система генерирует синтетические данные и создает пользовательские судьи LLM, специфичные для каждой задачи».
Платформа предлагает четыре конфигурации агента:
- Извлечение информации: Преобразует документы (PDFS, электронные письма) в структурированные данные. Одним из вариантов использования может быть розничные организации, которые используют его для извлечения деталей продукта от PDF -файлов поставщика, даже при сложном форматировании.
- Помощник знаний: Предоставляет точные, цитируемые ответы из предприятия. Например, специалисты из производства могут получить мгновенные ответы от руководств по техническому обслуживанию, не копаясь через связующие.
- Пользовательский LLM: Обрабатывает задачи преобразования текста (суммирование, классификация). Например, организации здравоохранения могут настроить модели, которые суммируют заметки пациента для клинических рабочих процессов.
- Многоагентный руководитель: Оркестр для нескольких агентов для сложных рабочих процессов. Одним из примеров примера использования является фирмы финансовых услуг, которые могут координировать агенты для обнаружения намерений, поиска документов и проверки соответствия.
Агенты великолепны, но не забывайте о данных
Строительство и оценка агентов является основной частью подготовки ИИ предприятия, но это не единственная часть, которая необходима.
DataBricks позиционирует кирпичи мозаики, поскольку уровень потребления ИИ, сидящий на своем объединенном стеке данных. На саммите Data + AI DataBricks также объявил об общей доступности своей платформы для Dataflow Dataflow, которая была впервые просмотрена в 2024 году.
Lakeflow решает проблему подготовки данных. Он объединяет три критических поездках по проектированию данных, которые ранее требовали отдельных инструментов. Перерабатывает проглатывание, получая как структурированные, так и неструктурированные данные в DataBricks. Преобразование обеспечивает эффективную очистку, изменение и подготовку данных. Оркестровка управляет производственными рабочими процессами и планированием.
Соединение рабочего процесса является прямым: Lakeflow готовит корпоративные данные посредством единого проглатывания и преобразования, а затем агент Bricks создает оптимизированные агенты ИИ на этих подготовленных данных.
«Мы помогаем получить данные в платформу, а затем вы можете сделать ML, BI и AI Analytics», — сказал VentureBeat Билал Аслам, старший директор по управлению продуктами в DataBricks.
Выходя за рамки приема данных, кирпичи мозаики также получают выгоду от функций управления единством DataBricks. Это включает в себя элементы управления доступа и отслеживание линии данных. Эта интеграция гарантирует, что поведение агента уважает управление корпоративными данными без дополнительной конфигурации.
Агент, обучающийся на обратной связи с человеком
Один из общих подходов к руководству агентов ИИ сегодня — использовать системную подсказку. Тан сослался на практику «быстрого набивания», где пользователи вкладывают все виды руководства в подсказку в надежде, что агент будет следовать за ним.
Agent Bricks представляет новую концепцию под названием «Агент, обучающийся на отзывах человека». Эта функция автоматически корректирует компоненты системы на основе наведения естественного языка. Это решает то, что Тан называет проблему на фарце. Согласно Тангу, подход быстрого на фарнир часто не работает, потому что агентские системы имеют несколько компонентов, которые нуждаются в корректировке.
Агент, обучение от обратной связи человека, — это система, которая автоматически интерпретирует руководство естественного языка и корректирует соответствующие компоненты системы. Подход отражает усиление обучения от обратной связи с человеком (RLHF), но работает на уровне системы агента, а не на индивидуальных весах модели.
Система обрабатывает две основные проблемы. Во -первых, руководство естественного языка может быть расплывчатым. Например, что на самом деле означает «уважать голос вашего бренда»? Во -вторых, системы агентов содержат многочисленные точки конфигурации. Команды изо всех сил пытаются определить, какие компоненты нуждаются в корректировке.
Система устраняет предположения о том, какие компоненты агента нуждаются в корректировке для конкретных поведенческих изменений.
«Это, как мы считаем, помогут агентам стать более управляемыми», — сказал Тан.
Технические преимущества по сравнению с существующими рамками
Сегодня нет недостатка в агентских структурах развития ИИ на рынке. Среди растущего списка вариантов поставщиков — инструменты от Langchain, Microsoft и Google.
Тан утверждал, что то, что отличает кирпичи мозаичного агента, — это оптимизация. Вместо того, чтобы требовать ручной конфигурации и настройки, агентские кирпичи автоматически включает в себя несколько методов исследования: TAO, в контекстном контексте, быстрое оптимизация и тонкая настройка.
Когда дело доходит до агента до агента, сегодня на рынке есть несколько вариантов, включая протокол Google Agent2agent. Согласно Тангу, DataBricks в настоящее время изучает различные протоколы агентов и не привержен ни одному стандарту.
В настоящее время агент Bricks обрабатывает связь с агентом к агенту с помощью двух основных методов:
- Разоблачение агентов в качестве конечных точек, которые могут быть заверены в различные протоколы.
- Использование многоагентного руководителя, который осведомлен MCP (протокол контекста модели).
Стратегические последствия для лиц, принимающих решения предприятия
Для предприятий, стремящихся вести путь в ИИ, очень важно иметь правильные технологии для оценки качества и эффективности.
Развертывающие агенты без оценки не приведут к оптимальному исходу, и ни один из них не будет иметь агентов без основной основы данных. При рассмотрении технологий разработки агентов крайне важно иметь надлежащие механизмы для оценки лучших вариантов.
Агент, обучающийся на подходе от обратной связи с человеком, также заслуживает внимания для лиц, принимающих решения предприятия, поскольку он помогает направить агент AI к наилучшему результату.
Для предприятий, стремящихся возглавить в развертывании агента искусственного интеллекта, эта разработка означает, что инфраструктура оценки больше не является фактором блокировки. Организации могут сосредоточиться на идентификации вариантов использования и подготовке данных, а не на структуре оптимизации.
Источник