Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше
Любой, кто справился с работой с клиентом-или даже просто работал с командой из более чем нескольких людей-знает, что у каждого человека на земле есть свои уникальные, иногда сбивающие с толку предпочтения.
Понимание предпочтений каждого человека трудно даже для нас, людей. Но как насчет моделей искусственного интеллекта, которые не имеют прямого человеческого опыта, на котором можно рисовать, не говоря уже о том, чтобы использовать в качестве структуры, чтобы применить к другим при попытке понять, чего они хотят?
Команда исследователей из ведущих учреждений и стартапов Antropric, компания, стоящая за крупной языковой моделью (LLM)/Chatbot Claude 2, работает над этой самой проблемой и предложила, казалось бы, очевидное решение: заставьте модели искусственного интеллекта, чтобы задать больше вопросов пользователей, чтобы выяснить, что они действительно хотят.
Вступление в новый мир понимания ИИ через ворота
Антропный исследователь Алекс Тамкин, вместе с коллегами Белиндой З. Ли и Джейкобом Андреасом из Массачусетского института технологического института (Массачусетского технологического института) Лабораторию искусственного интеллекта (CSAIL), а также Ноа Гудмана из Стэнфорда опубликовал исследовательский документ ранее в этом месяце по их методу, который они называют «активной задачей Generation Active Active (Gate).
Их цель? «Используйте (большой язык) модели, чтобы помочь преобразовать человеческие предпочтения в автоматизированные системы принятия решений»
Другими словами: воспользуйтесь существующей возможностью LLM анализировать и генерировать текст и использовать его, чтобы задать письменные вопросы пользователя при первом взаимодействии с LLM. Затем LLM будет читать и включить ответы пользователя в свои поколения в будущем, жить на лету и (это важно) вывод Из этих ответов — исходя из того, с какими другими словами и концепциями они связаны в базе данных LLM, — относительно того, что пользователь в конечном итоге просит.
Как пишут исследователи: «Эффективность языковых моделей (LMS) для понимания и создания текста свободной формы предполагает, что они могут быть способны выявлять и понимать пользовательские предпочтения».
Три ворота
По словам исследователей, этот метод может применяться различными способами:
- Генеративное активное обучение: Исследователи описывают этот метод как LLM, производящий примеры того типа ответов, которые он может дать, и спрашивает, как пользователь любит их. Один из примеров вопроса, который они предоставляют для LLM, — это: «Вас интересно в следующей статье? Исходя из того, что отвечает пользователь, LLM будет доставлять более или менее контент в этом направлении.
- Да/Нет вопросов Поколение: Этот метод настолько прост, как кажется (и получает). LLM будет задавать бинарные вопросы или нет таких вопросов, как: «Вам нравится читать статьи о здоровье и благополучии?» А затем примите во внимание ответы пользователя при ответе в будущем, избегая информации, которую он связывает с теми вопросами, которые получили ответ «нет».
- Открытые вопросы: Аналогично первому методу, но даже шире. Как пишут исследователи, LLM будет стремиться получить «самые широкие и самые абстрактные знания» от пользователя, включая такие вопросы, как «какие хобби или занятия вам нравятся в свободное время (…), и почему эти хобби или действия очаровывают вас?»
Многообещающие результаты
Исследователи пробовали метод Gate в трех доменах — рекомендации контента, моральные рассуждения и проверка электронной почты.
Основная настройка GPT-4 от Anpropic соперника из OpenAI и набора 388 оплачиваемых участников со скоростью 12 долларов в час, чтобы ответить на вопросы от GPT-4 и оценить его ответы, исследователи обнаружили, что ворота часто дают более точные модели, чем базовые, требующие сопоставимых или менее умственных усилий от пользователей.
В частности, они обнаружили, что GPT-4, настраиваемый с Gate, выполнил лучшую работу по угаданию индивидуальных предпочтений каждого пользователя в своих ответах примерно на 0,05 точек значимости при измерении субъективно, что звучит как небольшое количество, но на самом деле многое, когда начинается с нуля, как это делает шкала исследователей.

В конечном счете, исследователи утверждают, что они «представляли первоначальные доказательства того, что LMS может успешно реализовать Gate для выявления человеческих предпочтений (иногда) более точно и с меньшими усилиями, чем контролируемое обучение, активное обучение или подходы, основанные на подсказке».
Это может сэкономить разработчикам корпоративного программного обеспечения много времени при загрузке чат-ботов с LLM для приложений, ориентированных на клиента или сотрудников. Вместо того, чтобы обучать их на корпус данных и пытаться использовать их для определения индивидуальных предпочтений клиентов, настраивая их предпочтительные модели для выполнения танца Q/A, указанного выше, может облегчить им привлечение привлекательных, позитивных и полезных опытов для своих предполагаемых пользователей.
Таким образом, если ваш любимый AI Chatbot начнет задавать вам вопросы о ваших предпочтениях в ближайшем будущем, есть большая вероятность, что он может использовать метод Gate, чтобы попытаться дать вам лучшие ответы в будущем.
Источник