Этот исследователь превратил Open’s Open Weights Model GPT-OSS-20B в модель «база», не связанную с Risesing, с меньшим выравниванием, большей свободой

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Openai’s Новые, мощные открытые веса Семья AI большой языковой модели (LLM) GPT-OSS был выпущен менее двух недель назад Под разрешающей лицензией Apache 2.0-первая запуск модели компании в открытом весе со времен GPT-2 в 2019 году-но разработчики за пределами компании уже изменяют ее.

Одним из самых ярких примеров является Джек Моррис, аспирант Tech Cornell, бывший резидент Google Brain и нынешний исследователь в Meta, который На этой неделе обнародован GPT-OSS-20B-базе, его собственная переработанная версия более мелкой модели GPT-OSS-201 Удаляет поведение «рассуждения» модели и возвращает его к предварительно обученной «базовой» версии, которая предлагает более быстрые, свободные, более беспрецедентные и неограниченные ответы.

Модель теперь доступна для обнимания лица под разрешительная лицензия MITпозволяя использовать его для обоих дополнительных Исследовательские и коммерческие приложения.

Как GPT-OSS-20B-база отличается от моделей GPT-OSS OpenAI

Чтобы понять, что сделал Моррис, это помогает узнать Разница между выпуском Openai и тем, что исследователи ИИ называют «базовой моделью».

Большинство LLMS, предлагаемые ведущими лабораториями искусственного интеллекта, такими как OpenAI, Anpropic, Google и даже игроки с открытым исходным кодом, такие как Meta, DeepSeek и команда Alibaba QWEN, «после обучения».

Это означает, что они прошли через дополнительную фазу, когда он подвергается воздействию кураторских примеров желаемого поведения.

Для моделей, настроенных на инструкции, это означает, что они дают ему много примеров инструкций в сочетании с идеальными ответами, поэтому он учится реагировать более полезно, вежливо или безопасно на запросы естественного языка.

Модели GPT-OSS Openai, выпущенные 5 августа, были «оптимизированы рассуждением»: обученные и настраивались не только для предсказания следующего слова, но и для безопасного, последовательного следования инструкциям, часто выходя через проблемы со структурированной «цепью мышления», прежде чем выпустить окончательный ответ.

Это тенденция, которая восходит к модели Operai O1, выпущенной почти год назад в сентябре 2024 года, но в настоящее время приняли многочисленные ведущие лаборатории искусственного интеллекта — заставляя модели более длительно думать о нескольких шагах и проверять их собственную работу перед Вывод хорошо разобранный ответ пользователю.

Это делает их более подходящими для таких задач, как кодирование, решение математических задач или ответа на фактические вопросы с объяснениями, но также означает, что их ответы отфильтрованы и удерживаются от небезопасного или нежелательного содержания.

Базовая модель отличается. Это необработанная, предварительно подготовленная версия крупной языковой модели до того, как применяется специфическая для рассуждения выравнивание. Базовые модели просто пытаются предсказать следующую часть текста, учитывая то, что было раньше, без встроенных ограждений, стилистических предпочтений или поведения с отказом.

Они ценится некоторыми исследователями, потому что они может создать более разнообразный и менее ограниченный выход, И потому что изучение их невыполненного поведения может Раскрыть, как модели хранят знания и закономерности из их обучающих данных.

Цель Морриса состояла в том, чтобы «отменить» процесс выравнивания Openai и восстановить меньший GPT-OS-201

«Мы в основном изменили часть обучения LLM, поэтому у нас есть что-то, что снова производит естественный текст»,-написал он в «X Thread», объявляя о проекте. «Это больше не участвует в кроватке. Она вернулась к модели, которая просто предсказывает следующий токен в общем тексту».

OpenAI не открыл базовую модель с GPT-2 в 2019 году. Недавно они выпустили GPT-OSS, который только рассуждает…

или это?

Оказывается, что под поверхностью все еще есть сильная базовая модель. Итак, мы извлекли это.

Представляете GPT-OSS-20B-базу? pic.twitter.com/3xryqglf8z
— Джек Моррис (@jxmnop) 13 августа 2025 года

Как базовая модель была извлечена из GPT-OS-20b от Openai

Вместо того, чтобы пытаться джейлбрейк модель с умными подсказками, которые, по словам Морриса, оказался неэффективным во время своих ранних экспериментов,-он взял на себя другой удар после разговора с бывшим соучредителем OpenAI, бывшим антропным исследователем и нынешними мыслительными машинами Главный ученый Джон Шульман.

Ключ заключалась в том, чтобы думать об обращении с выравниванием как о небольшой проблеме оптимизации: если большая часть предварительно предварительно предоставленных знаний модели все еще присутствует в его весах, то может потребоваться только крошечное, низкое обновление, чтобы подтолкнуть его к поведению базовой модели.

Моррис реализовал эту идею, применив обновление LORA (низкий рейтинг) только на три слоя модели-слои MLP в позициях 7, 15 и 23-с рангом 16.

Это означало обучение около 60 миллионов параметров, или 0,3% от 21 миллиарда модели. Он использовал около 20 000 документов из набора данных FineWeb, сохраняя как можно ближе к оригинальной предварительной подготовке («…»), чтобы модель не изучала бы ничего нового, просто повторного общего свободного текста.

Обучение заняло четыре дня на восемь графических процессоров NVIDIA H200, Моррис рассказал VentureBeat через прямое сообщение на X, с скоростью обучения 2E-6, размером партии 16 и максимальной длиной последовательности 8,192 токенов.

После этого он объединил веса Lora обратно в модель, чтобы пользователи могли запустить ее как автономный, полностью созданный артефакт.

Моррис также должен был бороться с ограничениями текущих открытых инструментов для тонкой настройки смеси экспертов (MOE), таких как GPT-OSS.

Моррис сказал, что он использовал структуру Hugging Face, которая, по его словам, часто разбивается и поддерживает только определенные режимы обучения, и часто писал свой собственный жгут для контрольно -пропускного пункта и пропускает партии данных, которые рискуют перегружать память графических процессоров.

Важно отметить, что в ответ на вопросы и критику со стороны сообщества ИИ на X Моррис также пояснил, что он не утверждает, что восстановил базовую модель «веса» — внутренние условия искусственных нейронов, которые составляют нейронную сеть модели и управляют ее поведением.

Мир ИИ сейчас сумасшедший, потому что вы можете просто утверждать, что извлек базовую модель из GPT-OSS, в то время как вы только что обучили LORA на FineWeb lol https://t.co/oanawpmq26
— Нильс Рогге (@nielsrogge) 15 августа 2025 года

Скорее, Моррис говорит, что его работа «восстановила распределение базовой модели * с некоторой ошибкой», то есть модели вероятности, которые модель использует для генерации выходов, даже если веса, производящие эти модели, могут отличаться.

Некоторые люди запутаются в эксперименте —

Мы не восстановили веса базовой модели *. Это может быть даже невозможно.

Мы восстановили распределение базовой модели *, с некоторой ошибкой. Важный вопрос — сколько.

Попытка выяснить это прямо сейчас… https://t.co/lfug5qy4h0
— Джек Моррис (@jxmnop) 15 августа 2025 года

Как новое поведение модели GPT-OSS-20B-базы отличается от GPT-OSS-20B

Полученная база GPT-OSS-20B заметно более свободна в своих результатах. Он больше не по умолчанию объясняет рассуждение шаг за шагом и будет создавать более широкий спектр ответов, в том числе модель Unders Open, выровненная Создание оружия, перечисление ненормативной лексики или планирование незаконной деятельности.

В коротких тестах Моррис нашел это может также воспроизвести дословные отрывки из авторских праввключая Три из шести выдержек книги он пробовал, показывая, что какой -то запоминающийся материал все еще доступен.

Несмотря на это, некоторые следы выравнивания остаются. Моррис отметил, что если вы предпринимаете модель в формате помощника в стиле («Человек:… помощник:…»), это иногда будет действовать как вежливый чат-бот. И При прохождении через оригинальный шаблон чата GPT-OSS он все равно может выполнять аргументированные задачихотя и с некоторой потерей в качестве.

Для достижения наилучших результатов в режиме свободного текста он советует составить подсказки с особым токеном начала последующей последовательности <| startoftext |> и полностью избегает шаблонов чата.

Опираясь на большую семейную релиз GPT-OSS Openai

Семья GPT-OSS дебютировала в значительном внимании. Две модели-GPT-OS-120B и GPT-OSS-201 Они были выпущены по разрешающей лицензии Apache 2.0, позволяя неограниченному местному использованию, тонкоостремированию и коммерческому развертыванию.

Производительность производительности от OpenAI показала более крупную модель 120B, соответствующую или превышающему запатентованную O4-Mini в отношении рассуждений и задач по использованию инструментов, причем меньшие 20B конкуренции с O3-Mini.

Это был первый выпуск Openai за шесть лет, что широко интерпретируется как Ответ на конкурентное давление со стороны других поставщиков открытых весов, в том числе китайский DeepSeek R1 и QWEN 3.

Компания позиционировала GPT-OSS как способ для повторного введения разработчиков, которые перешли на конкурентные модели с открытым исходным кодом, и в качестве платформы для исследований безопасности в системах открытого веса.

Реакцию на начальный GPT-OSS смешали

Реакция разработчика на модели GPT-OSP Openai была стойкой смешанной, с реакциями по всему совету от энтузиазма до разочарования.

Сторонники высоко оценили разрешительную лицензию, эффективность и сильные показатели на контрольных показателях STEM.

Генеральный директор Face Clem Delangue описал релиз как «значимое дополнение к открытой экосистеме» и призвал сообщество дать ему время для созревания.

Критики утверждали, что модели, по -видимому, активно обучаются синтетическим данным, что делает их превосходными в математике и кодировании, но менее способными для творческого письма, общих мировых знаний и многоязычных рассуждений.

Некоторые ранние тестеры также выразили обеспокоенность по поводу затяжных фильтров безопасности и возможного геополитического смещения.

На этом фоне, База Morris GPT-OSS-20B выделяется как конкретный пример того, как модели открытого веса могут быть адаптированы и перепрофилированы в дикой природе в течение нескольких дней после освобождения.

Действительно, в отличие от того, как был получен GPT-OSP Openai, большинство ответов на работу Морриса, которые я видел, теплые и воодушевленные. Как написал один из компьютерных ученого на X: «Это самая крутая вещь, которую я видел в Твиттере (x) за последние несколько месяцев».

Человек, это самая крутая вещь, которую я видел в Твиттере в последние несколько месяцев, я люблю базовые модели
— Людан (@jmrludan) 15 августа 2025 года

Подход убирает большую часть поведения, встроенную и возвращает модель к чему -то ближе к необработанной, предварительно предварительному системе — сдвиг, который ценен для исследователей, изучающих запоминание, предвзятость или влияние выравнивания, но также сопровождается более высокими рисками безопасности.

Кроме того, Моррис говорит, что его работа по восстановлению моделей рассуждений для предварительно обученных, не запрашиваемых базовых моделей будет продолжаться путем сравнения извлечения в неэрижационных моделях, инструктирующих, подобные тем, которые предлагаются Qwen.

Источник

Как GPT-OSS-20B-база отличается от моделей GPT-OSS OpenAI

Как базовая модель была извлечена из GPT-OS-20b от Openai

Как новое поведение модели GPT-OSS-20B-базы отличается от GPT-OSS-20B

Опираясь на большую семейную релиз GPT-OSS Openai

Реакцию на начальный GPT-OSS смешали

Как My Notes AI помогает студентам и профессионалам в 2025 году

Как ИИ меняет способность людей думать самостоятельно

Рекомендуем

Оставить комментарий Отменить ответ