Агенты ИИ попадают в стену ответственности. У Mixus есть план преодоления его с использованием человеческих надзирателей на рабочих процессах высокого риска

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

В то время как предприятия сталкиваются с проблемами развертывания агентов искусственного интеллекта в критических приложениях, появляется новая, более прагматическая модель, которая возвращает людей к контролю в качестве стратегической защиты от неудачи ИИ.

Одним из таких примеров является Mixus, платформа, которая использует подход «коллеги в петле», чтобы сделать агенты искусственного интеллекта надежными для критически важной работы.

Этот подход является реакцией на растущие доказательства того, что полностью автономные агенты являются азартной игрой с высокими ставками.

Высокая стоимость неконтролируемого ИИ

Проблема галлюцинаций ИИ стала ощутимым риском, поскольку компании изучают приложения ИИ. В недавнем инциденте в курсоре «Редактор кодов» на основе AI увидел, как свой собственный бот поддержки изобретает фальшивую политику, ограничивающую подписки, вызвав волну отмены общественных клиентов.

Точно так же компания Fintech Klarna, как известно, изменила курс по замене агентов по обслуживанию клиентов на ИИ после признания этого шага, что привело к снижению качества. В более тревожном случае бизнес-чат-бот с AI, работающим на двигателе с искусственным технологическим баллом в Нью-Йорке, посоветовал предпринимателям участвовать в незаконных практиках, подчеркивая риски катастрофических соответствий неконтролируемых агентов.

Эти инциденты являются симптомами большего разрыва в способности. Согласно исследовательскому документу Salesforce May 2025, сегодняшние ведущие агенты преуспевают только в 58% случаев по одностадийным задачам и всего в 35% случаев на многоэтапных, подчеркивая «значительный пробел между текущими возможностями LLM и многогранными требованиями реальных сценариев предприятий».

Модель коллеги в петле

Чтобы преодолеть этот разрыв, новый подход фокусируется на структурированном человеческом надзоре. «Агент ИИ должен действовать в вашем направлении и от вашего имени»,-сказал VentureBeat соучредитель Mixus Эллиот Кац. «Но без встроенного организационного надзора, полностью автономные агенты часто создают больше проблем, чем они решают».

Эта философия лежит в основе модели Mixus в петле, которая внедряет человеческую проверку непосредственно в автоматизированные рабочие процессы. Например, крупный розничный продавец может получать еженедельные отчеты от тысяч магазинов, которые содержат критические эксплуатационные данные (например, объемы продаж, часы работы, коэффициенты производительности, запросы на компенсацию из штаб -квартиры). Человеческие аналитики должны тратить часы вручную, просматривая данные и принимая решения на основе эвристики. С помощью Mixus агент AI автоматизирует тяжелую подъемную работу, анализируя сложные узоры и помечая аномалии, такие как необычно высокие запросы на зарплату или выбросы производительности.

Для решений с высокими ставками, такими как разрешения на оплату или нарушения политики-рабочие процессы, определяемые человеком, как «высокий риск»-агент делает паузу и требует одобрения человека, прежде чем продолжить. Разделение труда между ИИ и людьми было интегрировано в процесс создания агента.

«Этот подход означает, что люди участвуют только в том случае, когда их опыт фактически добавляет ценность-как правило, критические 5-10% решений, которые могут оказать значительное влияние-в то время как оставшиеся 90-95% рутинных задач проходят автоматически»,-сказал Кац. «Вы получаете скорость полной автоматизации для стандартных операций, но человеческий надзор надается точно, когда контекст, суждение и подотчетность важнее всего».

В демонстрации, которую команда Mixus показала для VentureBeat, создание агента-это интуитивно понятный процесс, который можно сделать с помощью простых текстовых инструкций. Например, чтобы построить агента по проверке фактов для журналистов, соучредитель Shai Magzimof просто описал многоэтапный процесс на естественном языке и поручил платформе внедрить этапы проверки человека с конкретными порогами, например, когда претензия является высоким риском и может привести к репутационному ущербу или юридическим последствиям.

Одной из основных сторон платформы является его интеграция с такими инструментами, как Google Drive, Email и Slack, позволяя предпринимательским пользователям вводить свои собственные источники данных в рабочие процессы и взаимодействовать с агентами непосредственно с их выбора, без необходимости переключать контексты или изучить новый интерфейс (например, агент по проверке фактов был поручен отправлять запросы на утверждение в электронное письмо редактора).

Возможности интеграции платформы распространяются дальше для удовлетворения конкретных потребностей предприятия. Mixus поддерживает протокол контекста модели (MCP), который позволяет предприятиям подключать агенты к своим индивидуальным инструментам и API, избегая необходимости изобрести колесо для существующих внутренних систем. В сочетании с интеграциями для других корпоративных программ, таких как JIRA и Salesforce, это позволяет агентам выполнять сложные кроссплатформенные задачи, такие как проверка билетов на открытые инженерные билеты и сообщать о состоянии менеджеру по Slack.

Человеческий надзор как стратегический множитель

Пространство ИИ Enterprise в настоящее время проходит проверку реальности, когда компании переходят от экспериментов к производству. Консенсус среди многих лидеров отрасли состоит в том, что люди в курсе являются практической необходимостью для агентов, чтобы достоверно работать.

Агенты ИИ, скорее всего, будут следовать за траекторией самостоятельного вождения, где вам нужен человек в курсе для длинного хвоста задач. Большая разница в том, что мы получим растущее число автономных агентов на этом пути, где полное самостоятельное вождение — это все или ничего. https://t.co/5dr7cgs7jn
— Аарон Леви (@levie) 20 июня 2025 года

Совместная модель Mixus изменяет экономику масштабирования ИИ. Mixus предсказывает, что к 2030 году развертывание агента может вырасти в 1000x, и каждый надзиратель человека станет более эффективным, поскольку агенты ИИ станут более надежными. Но общая потребность в человеческом надзоре все равно будет расти.

«Каждый человек -надзиратель управляет экспоненциально большей работой с ИИ с течением времени, но вам все равно нужно больше общего надзора, поскольку развертывание ИИ взрывается по всей вашей организации», — сказал Кац.

Для лидеров предприятия это означает, что человеческие навыки будут развиваться, а не исчезнуть. Вместо того, чтобы быть замененным ИИ, эксперты будут способствовать ролям, где они организуют парки агентов ИИ и обрабатывают решения с высокими ставками, отмеченные для их обзора.

В этой структуре создание сильной функции человеческого надзора становится конкурентным преимуществом, что позволяет компаниям использовать ИИ более агрессивно и безопасно, чем их конкуренты.

«Компании, которые овладеют этим умножением, будут доминировать в их отраслях, в то время как они преследуют полную автоматизацию, будут бороться с надежностью, соблюдением и доверием», — сказал Кац.

Источник

Высокая стоимость неконтролируемого ИИ

Модель коллеги в петле

Человеческий надзор как стратегический множитель

Агенты ИИ попадают в стену ответственности. У Mixus есть план преодоления его с использованием человеческих надзирателей на рабочих процессах высокого риска

От галлюцинаций до аппаратного обеспечения: уроки из реального проекта компьютерного видения ушли вбок.

Рекомендуем

Оставить комментарий Отменить ответ