Як шум впливає на точність розпізнавання об'єктів безпілотниками


Вчені дослідили, наскільки різні рівні шуму впливають на якість розпізнавання об'єктів нейронними мережами БПЛА

Зображення Freepik
Зображення Freepik

Дослідження, проведене групою науковців з Національного аерокосмічного університету «Харківський авіаційний інститут», розкрило важливі аспекти впливу шумових завад на ефективність розпізнавання об'єктів за допомогою безпілотних літальних апаратів (БПЛА).

Науковці зосередили увагу на вивченні того, як різні рівні шуму впливають на точність локалізації та класифікації об'єктів сучасними нейронними мережами. Дослідження проводилося з використанням п'яти популярних нейромереж: YOLO версій 5 та 8, Faster RCNN, RetinaNet та SSD.

Для експерименту вчені використали dataset VisDrone, який містить 6471 зображення з понад 344 тисячами маркованих об'єктів. Це дозволило створити максимально реалістичну модель для тестування впливу шумових завад.

Ключовим методом дослідження стало додавання адитивного білого гаусівського шуму (AWGN) до зображень з різною інтенсивністю — від майже непомітного (стандартне відхилення 3−5) до досить значного (стандартне відхилення 30−50).

Результати експерименту показали, що різні нейронні мережі по-різному реагують на шумові впливи. Зокрема, мережі YOLO (версії 5 та 8) виявилися найбільш стійкими до шуму. При низьких рівнях шуму (стандартне відхилення до 10) практично не спостерігалося зниження якості розпізнавання.

Важливим висновком стало те, що локалізація об'єктів страждає менше, ніж їх класифікація. При максимальних рівнях шуму метрика локалізації (Intersection over Union) знижувалася в середньому на 10−20%, тоді як метрика класифікації падала на 25−35%.

Особливо чутливими до шуму виявилися мережі з великою кількістю локалізованих блоків, зокрема Faster RCNN. Це пов'язано з тим, що зі збільшенням кількості аналізованих блоків зростає ймовірність неправильної класифікації.

Цікавим спостереженням стала різна поведінка мереж при різних рівнях шуму. Наприклад, SSD Lite показала найменше падіння класифікаційної точності (13,6%), тоді як Faster RCNN втратила понад 50% точності при максимальних шумових навантаженнях.

Дослідники підкреслюють практичну значимість отриманих результатів. В реальних умовах експлуатації БПЛА зображення можуть мати різний рівень шуму через обмеження технічних характеристик камер, умови передачі даних та компресії.

Дослідження проводилося колективом науковців: Ростислав Цехмистро, Олексій Рубель, Олександр Присяжнюк та Володимир Лукін. Робота виконана в Національному аерокосмічному університеті «Харківський авіаційний інститут».

DOI