Революція у відстеженні об'єктів: Найефективніші алгоритми хешування зображень


Українські вчені розкрили найкращі методи трекінгу для обмежених комп'ютерних систем

Зображення Freepik
Зображення Freepik

Дослідження науковців Національного аерокосмічного університету «Харківський авіаційний інститут» представило вагомі результати в галузі комп'ютерного зору, які можуть кардинально змінити підходи до відстеження об'єктів у системах з обмеженими обчислювальними ресурсами.

Вчені Віталій Науменко, Сергій Абрамов та Володимир Лукін провели ґрунтовний порівняльний аналіз різних алгоритмів хешування зображень, метою якого було визначення найбільш ефективних методів для реального часу. Дослідження зосередилося на таких алгоритмах: aHash, mHash, dHash, pHash, LHash та LdHash.

Основна проблема, яку намагалися розв'язати дослідники, полягала у знаходженні оптимального балансу між швидкістю обробки та точністю трекінгу в умовах обмежених обчислювальних потужностей. Особливо актуальним це є для систем, де необхідне миттєве реагування, наприклад, в безпілотних літальних апаратах або роботизованих системах.

Методологія дослідження включала тестування алгоритмів на трьох відеопослідовностях: «OccludedFace2», «David» та «Sylvester». Науковці оцінювали два ключові параметри: коефіцієнт успішності трекінгу (TSR) та кількість оброблених кадрів за секунду (FPS).

Результати продемонстрували, що алгоритми aHash та mHash показали найвищу ефективність. Зокрема, aHash забезпечив найвищу швидкість обробки — до 97 кадрів за секунду, а mHash виявив кращу стійкість до змін освітлення та положення об'єкта.

Цікаво, що різні алгоритми мають унікальні характеристики. Наприклад, aHash працює найшвидше і має високу точність, в той час, як mHash демонструє кращу адаптивність до зовнішніх умов. Алгоритми dHash та pHash виявилися менш ефективними через чутливість до масштабування та обертання зображень.

Дослідження також показало важливість правильної стратегії пошуку. Так звана «init_template» стратегія, яка використовує незмінний initial шаблон, продемонструвала найкращі результати, уникаючи накопичення похибок у процесі трекінгу.

Науковці звернули особливу увагу на розмір хеш-вікна. Менші розміри (8×8, 16×16) забезпечують вищу швидкість обробки, а більші (32×32, 64×64) можуть підвищити точність шляхом зниження швидкодії.

Розроблені підходи можуть бути застосовані в багатьох галузях: від автономного водіння та систем безпеки до робототехніки та доповненої реальності.

DOI