Лидеры предприятия говорят, что рецепт для агентов искусственного интеллекта соответствует их существующим процессам, а не наоборот.

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Нет сомнений в том, что агенты ИИ — те, которые могут работать автономно и асинхронно за кулисами в предпринимательских рабочих процессах — являются темой Du Jour на предприятии прямо сейчас.

Но все больше обеспокоена тем, что все это — говорить, в основном ажиотаж, без особой субстанции.

Гартнер, например, отмечает, что предприятия находятся на «пике завышенных ожиданий», периода незадолго до разочарования, потому что поставщики не поддерживали свои разговоры с ощутимыми, реальными случаями использования.

Тем не менее, это не значит, что предприятия не экспериментируют с агентами ИИ и не видят раннего возврата инвестиций (ROI); Глобальные предприятия Block и GlaxoSmithkline (GSK), для их частей, изучают подтверждение концепций в финансовых услугах и обнаружении лекарств.

«Многоагент-это абсолютно то, что будет дальше, но мы выясняем, как это выглядит таким образом, чтобы встретиться с человеком, делает его удобным»,-сказал Брэд Аксен, технологический лидер Блока для ИИ и платформ данных, генеральный директор Venturebeat и главный редактор Мэтт Маршалл на недавнем событии SAP Impact Impact в этом месяце.

Работа с одним коллегой, а не рой ботов

Блок, родительская компания из 10 000 человек из Square, Cash App и Afterpay, рассматривает себя в режиме полного обнаружения, в январе развернув совместимую рамку агента ИИ, кодовой Гусь.

Гус был первоначально введен для задач по разработке программного обеспечения и в настоящее время используется 4000 инженеров, а в ежемесячном удвоении удвоилось внедрение. Платформа пишет около 90% кода и сэкономила инженерам около 10 часов работы в неделю путем автоматизации генерации кода, отладки и фильтрации информации.

В дополнение к написанию кода, Goose выступает в роли «цифрового товарища по команде», сжимая слабые и электронные потоки, интегрируя инструменты компании и нерестив новых агентов, когда задачи требуют большей пропускной способности и расширенного объема.

AXEN подчеркнул, что блок сосредоточен на создании одного интерфейса, который чувствует себя как работа с одним коллегой, а не с рой ботов. «Мы хотим, чтобы вы чувствовали, что работаете с одним человеком, но они действуют от вашего имени во многих местах разными способами», — пояснил он.

Gose работает в реальном времени в среде разработки, поиска, навигации и написания кода на основе выводов крупной языковой модели (LLM), а также автономно чтение и написание файлов, запуск кода и тестов, усовершенствования выходов и установки зависимостей.

По сути, любой может построить и управлять системой на их предпочтительном LLM, и гусь может быть концептуализирован как приложение. Он имеет встроенный настольный приложение и интерфейс командной строки, но разработчики также могут создавать пользовательские интерфейсы. Платформа построена на протоколе контекста модели Anpropic (MCP), все более популярном стандартизированном наборе API и конечных точках с открытым исходным кодом, который соединяет агенты с хранилищами данных, инструментами и средами разработки.

Гус был выпущен в рамках лицензии Apache с открытым исходным кодом 2.0 (ASL2), что означает, что каждый может свободно использовать, изменять и распространять его, даже для коммерческих целей. Пользователи могут получить доступ к базам данных DataBricks и делать SQL -вызовы или запросы без необходимости технических знаний.

«Мы действительно хотим придумать процесс, который позволяет людям получить ценность из системы без необходимости быть экспертом», — пояснил Аксен.

Например, при кодировании пользователи могут сказать, что они хотят на естественном языке, и структура будет интерпретировать это на тысячи строк кода, которые затем могут прочитать и просеивать. Блок также видит ценность в задачах сжатия, таких как чтение гуся, через Slack, электронную почту и другие каналы и суммирование информации для пользователей. Кроме того, в продажах или маркетинге агенты могут собирать соответствующую информацию о потенциальном клиенте и перенести ее в базу данных.

Агенты искусственного интеллекта недостаточно используются, но экспертиза человеческой области все еще необходима

Аксен отметил, что процесс был самым большим узким местом. Вы не можете просто дать людям инструмент и сказать им, чтобы они работали на них; Агенты должны отражать процессы, с которыми уже участвуют сотрудники. Пользователи людей не беспокоятся о технической основе, — скорее, о работе, которую они пытаются выполнить.

Поэтому строители должны смотреть на то, что пытаются делать сотрудники, и разработать инструменты, чтобы «как можно более буквально», — сказал Аксен. Затем они могут использовать это для цепей вместе и решать большие и большие проблемы.

«Я думаю, что мы чрезвычайно недооцениваем то, что они могут сделать», — сказал Аксен об агентах. «Это люди и процесс, потому что мы не можем не отставать от технологии. Между технологией и возможностью существует огромный разрыв».

И когда индустрия затчивает, будет ли еще место для опыта в области человеческой области? Конечно, говорит Аксен. Например, особенно в финансовых услугах, код должен быть надежным, соответствием и безопасным для защиты компании и пользователей; Следовательно, это должно быть рассмотрено человеческими глазами.

«Мы по -прежнему видим действительно важную роль для человеческих экспертов в каждой части управления нашей компанией», — сказал он. «Это не обязательно меняет то, что опыт означает как личность. Он просто дает вам новый инструмент, чтобы выразить его».

Блок, построенный на основе с открытым исходным кодом

Человеческий пользовательский интерфейс является одним из самых сложных элементов агентов ИИ, отметил Аксен; Цель состоит в том, чтобы сделать интерфейсы простыми в использовании, в то время как ИИ находится в фоновом режиме активно предпринимать действия.

Было бы полезно, отметил Аксен, если бы больше игроков отрасли включали в себя стандарты, подобные MCP. Например, «я бы хотел, чтобы Google просто отправился и получил публичный MCP для Gmail», — сказал он. «Это сделало бы мою жизнь намного проще».

Когда его спросили о приверженности Блока с открытым исходным кодом, он отметил: «У нас всегда была костяка с открытым исходным кодом», добавив, что за последний год компания «обновляла» свои инвестиции в открытые технологии.

«В пространстве, которое движется так быстро, мы надеемся, что сможем настроить управление с открытым исходным кодом, чтобы вы могли сделать это инструмент, который не хватает вас, даже когда появляются новые модели и новые продукты».

Опыт GSK с мульти агентами в Discovery Discovery

GSK является ведущим фармацевтическим разработчиком, уделяющим особое внимание вакцинах, инфекционным заболеваниям и исследованиям онкологии. Теперь компания начинает применять многоагентные архитектуры для ускорения обнаружения наркотиков.

Ким Брэнсон, GSK SVP и глобальный руководитель AI и ML, сказала, что агенты начинают трансформировать продукт компании и «абсолютно основные для нашего бизнеса».

Ученые GSK объединяют специфичные для домена LLM с онтологиями (понятия и категории предметов, которые указывают на свойства и отношения между ними), пояснил Брэнсон.

Это помогает им запрашивать гигантские научные наборы данных, планировать эксперименты (даже если нет наземной истины) и собирать доказательства по геномике (изучение ДНК), протеомику (изучение белка) и клинические данные. Агенты могут поверхностно вспять, проверять соединения данных и сжать исследовательские циклы.

Брэнсон отметил, что научное открытие прошло долгий путь; Время секвенирования сократилось, а исследования протеомики намного быстрее. В то же время, однако, Discovery становится все более сложным, поскольку все больше и больше данных накоплены, особенно через устройства и носимые устройства. Как сказал Брэнсон: «У нас есть более непрерывные данные импульса о людях, чем мы когда -либо имели раньше как вид».

Людям может быть почти невозможно проанализировать все эти данные, поэтому цель GSK состоит в том, чтобы использовать ИИ, чтобы ускорить время итерации, отметил он.

Но в то же время ИИ может быть хитрым в большой фармации, потому что часто нет наземной правды, не проводя большие клинические эксперименты; Это больше о гипотезах и ученых, изучающих доказательства, чтобы придумать возможные решения.

«Когда вы начинаете добавлять агентов, вы обнаружите, что большинство людей на самом деле даже не имеют стандартного способа сделать это между собой», — отметил Брэнсон. «Эта дисперсия не плохая, но иногда это приводит к другому вопросу».

Он сказал: «У нас не всегда есть абсолютная правда для работы — в противном случае моя работа была бы намного проще».

Это все дело в том, чтобы придумать правильные цели или знать, как спроектировать то, что может быть биомаркером или доказательством различных гипотез, объяснил он. Например: Является ли это лучшим проспектом для людей с раком яичников в этом конкретном состоянии?

Чтобы ИИ понимал, что рассуждения требуют использования онтологий и задания таких вопросов, как «если это правда, что означает x?». Затем агенты, специфичные для домена, могут собрать соответствующие доказательства из больших внутренних наборов данных.

Брэнсон объяснил, что GSK построил эпигеномные языковые модели, основанные на церебсах, которые используют для вывода и обучения. «Мы строим очень конкретные модели для наших приложений, где ни у кого нет», — сказал он.

Скорость вывода важна, отметил он, независимо от того, для обратного и движения с моделью или автономными глубокими исследованиями, и GSK использует различные наборы инструментов на основе конечной цели. Но большие контексты не всегда ответ, и фильтрация имеет решающее значение. «Вы не можете просто играть в контекст», — сказал Брэнсон. «Вы не можете просто бросить все данные в эту штуку и доверять LM, чтобы выяснить это».

Продолжающееся тестирование критического

GSK проводит много тестирования в свои агентские системы, определяя приоритеты детерминизма и надежность, часто используя несколько агентов параллельно с результатами перекрестной проверки.

Брэнсон вспоминал, что, когда его команда впервые начала строить, у них был агент SQL, который они бежали «10 000 раз», и это необъяснимо внезапно «подделано» детали.

«Мы никогда не видели, чтобы это случилось снова, но это произошло однажды, и мы даже не поняли, почему это произошло с этим конкретным LLM», — сказал он.

В результате его команда часто запускает несколько копий и моделей параллельно, обеспечивая призыв к инструментам и ограничениям; Например, два LLM будут выполнять точно одинаковую последовательность, и ученые GSK пройдут их.

Его команда фокусируется на активных петлях обучения и собирает свои собственные внутренние контрольные показатели, потому что популярные, доступные, часто являются «довольно академическими и не отражают то, что мы делаем».

Например, они будут генерировать несколько биологических вопросов, набрать то, что, по их мнению, будет золотой стандарт, затем примените LLM против этого и посмотрит, как он ранжится.

«Мы особенно охотитесь за проблематичными вещами, где это не сработало, или это сделало тупо, потому что именно тогда мы узнаем что -то новое», — сказал Брэнсон. «Мы стараемся, чтобы люди использовали свое опытное суждение, где это важно».

Источник

Работа с одним коллегой, а не рой ботов

Агенты искусственного интеллекта недостаточно используются, но экспертиза человеческой области все еще необходима

Блок, построенный на основе с открытым исходным кодом

Опыт GSK с мульти агентами в Discovery Discovery

Продолжающееся тестирование критического

Близнецы нано банан улучшает согласованность и контроль редактирования изображений в масштабе для предприятий — но не идеально

Антропический запуск Клода для Chrome в ограниченной бета -версии, но быстрые инъекционные атаки остаются серьезным проблемой

Рекомендуем

Оставить комментарий Отменить ответ