Революція у відстеженні руху очей: нові нейромережеві технології


Вчені розробили унікальні алгоритми машинного навчання для точної класифікації рухів очей у наукових дослідженнях

Зображення Freepik
Зображення Freepik

Сучасні технології штучного інтелекту досягли принципово нового рівня у вивченні складних біомеханічних процесів руху очей. Дослідження, проведене науковцями з Українського державного університету науки і технологій, продемонструвало революційні можливості нейромережевих моделей у класифікації та аналізі рухів очей.

Дослідження зосереджувалося на порівнянні чотирьох основних алгоритмів: двох класичних методів на основі порогових значень (I-VT та I-DT) та двох сучасних підходів машинного навчання — Random Forest (RF) та Convolutional Neural Network (CNN). Науковці К.Ю. Островська та В.Г. Порохнявий провели глибокий аналіз ефективності цих алгоритмів у виявленні та класифікації різних типів рухів очей.

Експериментальне дослідження використовувало високоточний набір даних, записаний за допомогою професійного очного трекера з частотою 500 Гц. Унікальність дослідження полягала в застосуванні уніфікованого підходу до оцінки алгоритмів, що дозволило здійснити максимально об'єктивне порівняння.

Ключові результати продемонстрували вражаючі можливості сучасних нейромережевих технологій. Алгоритми Random Forest та Convolutional Neural Network показали суттєво вищу точність класифікації порівняно з традиційними методами на основі порогових значень. Зокрема, CNN продемонструвала 99% точності при класифікації фіксацій, 88% — для саккад та 76% — для постсаккадичних коливань.

Принципова відмінність нових алгоритмів полягає в їхній здатності аналізувати складні послідовності руху очей, враховуючи контекст та взаємозв'язок між послідовними вибірками. На відміну від класичних методів, які покладалися на прості порогові значення швидкості або дисперсії, нейромережеві моделі здатні виявляти тонкі патерни та закономірності.

Дослідження виявило критичну залежність традиційних алгоритмів від вибору порогових значень. Наприклад, для алгоритму I-DT зміна порогу дисперсії від 1 до 7 призводила до кардинальних змін у точності класифікації: від 39% до 99% для фіксацій та від 82% до 99% для саккад.

Важливим практичним результатом стала розробка архітектури системи, яка поєднує середовище Unity, алгоритми класифікації на Python та спеціальний API для обробки даних. Це відкриває нові можливості для застосування технології у різноманітних галузях — від когнітивної психології та неврології до маркетингових досліджень та інженерної діяльності.

Науковці особливо наголошують на міждисциплінарному потенціалі розробки. Технологія відстеження руху очей може бути корисною в дослідженнях керування автомобілем, вивченні когнітивних процесів, діагностиці неврологічних захворювань та створенні адаптивних інтерфейсів.

DOI