Штучний інтелект навчається краще за принципом дитячого садка
Вчені з Нью-Йоркського університету довели, що нейронні мережі ефективніше засвоюють складні завдання, коли спочатку тренуються на простих задачах
/sci314.com/images/news/cover/2929/018e6b8ddebd4795bde6374050d40d4c.jpg)
Команда вчених з Нью-Йоркського університету виявила, що рекурентні нейронні мережі значно краще справляються зі складними завданнями, коли їх спочатку навчають на простих когнітивних задачах. Результати дослідження опубліковані у журналі Nature Machine Intelligence.
Дослідники назвали цей підхід «навчанням за програмою дитячого садка», оскільки він базується на принципі поступового засвоєння базових навичок перед переходом до більш складних завдань. Цей метод нагадує те, як люди спочатку вивчають літери перед читанням або цифри перед арифметикою.
«З раннього віку ми розвиваємо набір базових навичок, таких як підтримання рівноваги або гра з м'ячем», пояснює Крістіна Савін, доцент Центру нейронауки та Центру науки про дані Нью-Йоркського університету. «З досвідом ці базові навички можна поєднувати для підтримки складної поведінки — наприклад, жонглювання кількома м'ячами під час їзди на велосипеді».
Рекурентні нейронні мережі є особливо корисними для розпізнавання мовлення та перекладу мов, оскільки вони призначені для обробки послідовної інформації на основі збережених знань. Однак коли справа доходить до складних когнітивних завдань, навчання таких мереж існуючими методами може виявитися складним і не відображати важливі аспекти поведінки тварин та людей, які системи штучного інтелекту намагаються відтворити.
Для вирішення цієї проблеми автори дослідження, до яких також увійшли Девід Хокер, постдокторський дослідник з Центру науки про дані НЮУ, та Крістін Константинопль, професор того ж центру, спочатку провели серію експериментів з лабораторними щурами.
Тварин навчали шукати джерело води у коробці з кількома відокремленими портами. Однак щоб знати, коли і де буде доступна вода, щури повинні були зрозуміти, що подача води пов'язана з певними звуками та освітленням портів, і що вода не подається відразу після цих сигналів. Щоб дістатися до води, тварини повинні були розвинути базові знання про кілька явищ та навчитися поєднувати ці прості завдання для досягнення мети.
Ці результати вказали на принципи того, як тварини застосовують знання простих завдань при виконанні більш складних.
Вчені використали ці висновки для навчання рекурентних нейронних мереж подібним чином. Замість пошуку води нейронні мережі виконували завдання з ставками, яке вимагало від цих мереж розвитку базового прийняття рішень для максимізації виграшу з часом. Потім дослідники порівняли цей підхід «навчання за програмою дитячого садка» з існуючими методами тренування нейронних мереж.
Загалом результати команди показали, що рекурентні нейронні мережі, навчені за моделлю дитячого садка, вчилися швидше, ніж ті, що тренувалися за поточними методами.
«Агенти штучного інтелекту спочатку повинні пройти дитячий садок, щоб пізніше краще вивчати складні завдання», зауважує Савін. «Загалом ці результати вказують на способи покращення навчання в системах штучного інтелекту та закликають до розробки більш цілісного розуміння того, як минулий досвід впливає на вивчення нових навичок».
Дослідження отримало підтримку від Національного інституту психічного здоров'я та проводилося з використанням обчислювальних ресурсів консорціуму Empire AI за підтримки штату Нью-Йорк, фонду Саймонса та фонду родини Секунда.
Схожі новини
- Мозок використовує окремі ділянки для різних типів пластичності22.06.2025, 11:52
- Рак можна виявити за три роки до діагнозу через аналіз крові22.06.2025, 10:22
- ШІ допомогло виявити 35 кліматичних явищ що регулюють температуру21.06.2025, 21:27
- Жінку відхилили на роботу через використання ChatGPT21.06.2025, 07:23
- NASA проведе атмосферні дослідження над містами США20.06.2025, 17:57