OpenAI випустила перші відкриті мовні моделі з 2019 року


Компанія OpenAI представила дві нові мовні моделі gpt-oss-120b та gpt-oss-20b з відкритими вагами для розробників та дослідників

Зображення CNBC
Зображення CNBC

Компанія OpenAI у вівторок оприлюднила дві мовні моделі з відкритими вагами вперше з моменту випуску GPT-2 у 2019 році. Нові моделі отримали назви gpt-oss-120b та gpt-oss-20b і призначені для використання як більш доступні варіанти, які розробники, дослідники та компанії можуть легко запускати та налаштовувати під свої потреби.

Модель штучного інтелекту вважається такою, що має відкриті ваги, якщо її параметри або елементи, які покращують її результати та прогнози під час навчання, є публічно доступними. Моделі з відкритими вагами можуть забезпечувати прозорість та контроль, але вони відрізняються від моделей з відкритим вихідним кодом, повний програмний код яких стає доступним для використання та модифікації людьми.

Кілька інших технологічних компаній, включаючи Meta, підтримувану Microsoft компанію Mistral AI та китайський стартап DeepSeek, також випустили моделі з відкритими вагами протягом останніх років. Президент OpenAI Грег Брокман розповів журналістам під час брифінгу, що було захоплююче спостерігати за розвитком екосистеми, і компанія з нетерпінням чекає можливості зробити свій внесок у це та справді просунути межі можливого.

Компанія співпрацювала з Nvidia, Advanced Micro Devices, Cerebras та Groq, щоб забезпечити належну роботу моделей на різноманітних чіпах. Генеральний директор Nvidia Дженсен Хуанг заявив у своєму повідомленні, що OpenAI показала світу, що можна побудувати на базі штучного інтелекту Nvidia, а тепер вони просувають інновації у програмному забезпеченні з відкритим вихідним кодом.

Випуск моделей OpenAI з відкритими вагами довго очікувався, частково через те, що компанія неодноразово відкладала запуск. У публікації в соціальній мережі X у липні генеральний директор OpenAI Сем Альтман повідомив, що компанії потрібно більше часу для проведення додаткових тестів безпеки та перегляду зон високого ризику. Це сталося після окремої публікації кількома тижнями раніше, де Альтман заявив, що моделі не будуть випущені у червні.

OpenAI повідомила у вівторок, що провела всебічне навчання та тестування безпеки своїх моделей з відкритими вагами. Компанія відфільтрувала шкідливі хімічні, біологічні, радіологічні та ядерні дані під час попереднього навчання та імітувала те, як зловмисники могли б спробувати налаштувати моделі для шкідливих цілей. Завдяки цьому тестуванню OpenAI визначила, що зловмисно налаштовані моделі не змогли досягти порогу високих можливостей у її Рамковій програмі готовності, яка є методом вимірювання та захисту від шкоди.

Компанія також співпрацювала з трьома незалежними експертними групами, які надали зворотний зв'язок щодо її оцінки зловмисного тонкого налаштування. OpenAI заявила, що люди можуть завантажити ваги для gpt-oss-120b та gpt-oss-20b на платформах як Hugging Face та GitHub під ліцензією Apache 2.0. Моделі будуть доступні для запуску на персональних комп'ютерах через програми як LM Studio та Ollama. Хмарні провайдери Amazon, Baseten та Microsoft також роблять моделі доступними.

Обидві моделі можуть обробляти складні міркування, використання інструментів та ланцюгове мислення і призначені для роботи будь-де від споживчого обладнання до хмари та програм на пристроях. Користувачі можуть запускати gpt-oss-20b на ноутбуці, наприклад, і використовувати її як персонального помічника, який може шукати файли та писати.

Сем Альтман заявив у повідомленні у вівторок, що компанія з нетерпінням чекає можливості зробити цю модель, результат мільярдів доларів досліджень, доступною для світу, щоб передати штучний інтелект у руки якомога більшої кількості людей.

Випуск цих моделей знаменує важливий крок у стратегії OpenAI щодо демократизації доступу до передових технологій штучного інтелекту. Моделі gpt-oss-120b та gpt-oss-20b представляють різні рівні складності та можливостей, що дозволяє користувачам обирати найбільш підходящий варіант залежно від їхніх потреб та доступних ресурсів.

Більша модель gpt-oss-120b містить 120 мільярдів параметрів, що робить її потужним інструментом для складних завдань обробки природної мови, тоді як менша gpt-oss-20b з 20 мільярдами параметрів призначена для більш легких застосувань та може ефективно працювати на менш потужному обладнанні.

Рішення OpenAI випустити моделі з відкритими вагами відображає зростаючий тренд у галузі штучного інтелекту щодо більшої відкритості та доступності передових технологій. Це також може сприяти прискоренню інновацій у сфері ШІ, оскільки дослідники та розробники матимуть можливість експериментувати з цими моделями та адаптувати їх для специфічних застосувань.

— За матеріалами CNBC