Інженери створили перший у світі фотонний процесор для навчання штучного інтелекту


Науковці з Університету Пенсильванії розробили революційний чип, який використовує світлові імпульси замість електричних схем для навчання систем штучного інтелекту в реальному часі

Зображення ZME Science
Зображення ZME Science

Інженери з Університету Пенсильванії здійснили революційний прорив у галузі обчислювальних технологій, створивши унікальний чип, який використовує світлові імпульси замість традиційних електричних схем та кремнію для роботи алгоритмів. Це перший у світі фотонний процесор, здатний навчати системи штучного інтелекту в реальному часі за допомогою світлових променів.

За останні роки штучний інтелект перетворився з перспективної технології майбутнього на невід'ємну частину нашого повсякденного життя. В основі цієї технології лежать нейронні мережі — масштабні системи штучних «нейронів», які налаштовуються через навчання. Хоча ці нейронні мережі демонструють високу ефективність, вони потребують величезної кількості обчислень та енергоємного обладнання.

Сьогодні більшість систем штучного інтелекту працює на спеціалізованих чипах, відомих як графічні процесори (GPU). Ці чипи забезпечують високу швидкість обробки даних, але споживають значну кількість енергії. Вартість навчання передових моделей штучного інтелекту, таких як GPT-4, може сягати мільйонів доларів, не кажучи вже про значні викиди вуглекислого газу.

Лян Фен, провідний автор дослідження, пояснює: «Нелінійні функції є критично важливими для навчання глибинних нейронних мереж. Наша мета полягала в тому, щоб вперше реалізувати це у фотоніці».

Новий чип від інженерів Пенсильванського університету здійснює навчання нейронних мереж повністю за допомогою світла, що значно зменшує енергоспоживання та суттєво підвищує швидкість обробки даних. Це не просто ефективніше рішення — це принципово новий підхід до обчислень.

Щоб зрозуміти суть цього прориву, варто розглянути принцип роботи штучного інтелекту. Сучасні системи штучного інтелекту базуються на нейронних мережах, які складаються з вузлів (аналогів нейронів), з'єднаних зваженими зв'язками. Коли дані проходять через мережу, деякі з'єднання посилюють сигнал, інші послаблюють його, і активуються лише певні шляхи.

Особливість полягає в тому, що ці системи не обмежуються простим додаванням та множенням чисел. Ключову роль відіграють нелінійні функції — математичні операції, де незначні зміни вхідних даних можуть призвести до значних змін результату. Саме нелінійність надає штучному інтелекту здатність розпізнавати образи, обличчя чи керувати автомобілями.

Протягом десятиліть інженери мріяли використовувати фотони замість електронів для обчислень. Світло має переваги: воно швидке і не нагрівається як електрика. Крім того, світлові промені можуть поширюватися паралельно, обробляючи кілька сигналів одночасно.

Проте світло має особливість — воно поширюється прямолінійно і в більшості матеріалів поводиться лінійно. Це означає, що воно добре підходить для додавання, але не для нелінійних перетворень, необхідних для штучного інтелекту. Хоча багато команд розробили світлові чипи, здатні виконувати лінійні математичні операції, жодній не вдалося використати світло для нелінійних функцій. До цього моменту.

Ключ до успіху полягає в спеціальному напівпровіднику, який реагує на світло. Його можна уявити як тонку плівку, прозорість якої змінюється залежно від способу освітлення.

Команда використовує два промені: один несе дані («сигнальне» світло), а інший діє як своєрідна невидима рука («накачувальне» світло), формуючи реакцію матеріалу. Точно налаштовуючи форму, інтенсивність та просторову структуру накачувального світла, дослідники можуть контролювати, як сигнальне світло поглинається, підсилюється або змінюється. Така взаємодія імітує нелінійні математичні функції, які використовуються в нейронних мережах для прийняття рішень.

«Ми не змінюємо структуру чипа», — пояснює Фен. «Ми використовуємо саме світло для створення візерунків усередині матеріалу, які потім змінюють характер поширення світла через нього».

Така конструкція ідеально підходить для машинного навчання. Оскільки чип може імітувати різні нелінійності на вимогу, він може адаптувати свою поведінку під час навчання. Це робить його програмованим не лише при налаштуванні, але й під час роботи.

Команда перевірила чип на класичних завданнях машинного навчання, таких як розрізнення видів ірисів та розпізнавання вимовлених слів. Чип самостійно навчався, коригуючи внутрішні світлові патерни для підвищення точності з часом.

У випадку з набором даних ірисів було досягнуто точності 96,7%, що перевершує показники аналогічних лінійних фотонних систем. При розпізнаванні вимовлених слів, таких як «Птах» і «Дерево», точність перевищила 91% з використанням значно меншої кількості з'єднань порівняно з традиційними цифровими мережами. Команда також довела можливість суттєвого спрощення апаратного забезпечення та значної економії енергії.

Технологія перебуває на ранній стадії розвитку. Чип використовує складні оптичні установки та прецизійні голографічні світлові патерни для контролю поведінки. Масштабування цієї технології потребуватиме інженерних та виробничих проривів.

Наступні кроки включають інтеграцію чипа з наявними кремнієвими фотонними платформами, збільшення кількості входів і виходів та дослідження практичного застосування в системах комп'ютерного зору, розпізнавання мовлення та робототехніці.

Дослідження опубліковано в журналі Nature Photonics.

— За матеріалами ZME Science