Штучний інтелект навчили перевіряти наукові статті без помилок


Модель OpenScholar аналізує 45 мільйонів наукових публікацій і цитує джерела так само точно, як експерти-люди.

Зображення nature.com
Зображення nature.com

Дослідники опублікували в Nature модель штучного інтелекту OpenScholar, яка переглядає наукову літературу краще за деякі великі мовні моделі і цитує джерела так само точно, як експерти-люди. Система поєднує мовну модель з базою даних із 45 мільйонів статей відкритого доступу.

Головна перевага OpenScholar полягає в тому, що вона зв'язує інформацію безпосередньо з літературою, що запобігає вигадуванню або «галюцинаціям» цитувань. Кілька комерційних інструментів для огляду літератури на основі штучного інтелекту вже використовують подібні методи, але мало хто з них випущений як відкрите програмне забезпечення.

За словами Акарі Асаї, дослідниці штучного інтелекту з Університету Карнегі-Меллон, відкритий код дозволяє науковцям не лише безкоштовно випробувати OpenScholar в онлайн-демонстрації, але й розгорнути його на власній машині. Крім того, метод можна використовувати для покращення навичок огляду літератури будь-якої великої мовної моделі.

За 14 місяців з моменту першої публікації OpenScholar у репозиторії arXiv компанії на кшталт OpenAI використали подібні методи для додавання інструментів «глибокого дослідження» до своїх комерційних моделей, що значно покращило їхню точність. Проте як невелика й ефективна система OpenScholar коштує значно дешевше за використання GPT-5 з глибоким дослідженням.

Автори визнають обмеження системи: вона не завжди знаходить найрепрезентативніші або найрелевантніші статті для запиту й обмежена обсягом своєї бази даних. Великі мовні моделі часто помиляються з цитуваннями, оскільки навчаються, будуючи зв'язки між словами в тренувальних даних. Принаймні 51 стаття, прийнята на конференцію NeurIPS у грудні 2025 року, містила неіснуючі або неточні цитування.

— За матеріалами nature.com