Сучасні технології приховування облич людей за допомогою object tracking на базі YOLOv5 та DeepSort

Автор(и)

  • А. Щур КПІ ім. Ігоря Сікорського, Україна
  • O. Польшакова КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.44.2024.302439

Ключові слова:

нейронна мережа, знаходження об’єктів, розпізнавання об’єктів, детектор, YOLO, DeepSORT, Фільтр Калмана

Анотація

Об’єктом дослідження є система автоматизованого розмиття людських облич на відео. В даній статті зроблений детальний огляд сучасних технології та принципів відслідковування об’єктів на відео з присвоюванням їм елементів унікальності. Так як наразі більшість відео редакторів все рівно більшу частину роботи залишають користувачеві, було вирішено провести оптимізацію даного процесу. Метою даної роботи є зниження часових витрат на виконання процесу приховування людських облич на відеофайлах. Для досягнення такої цілі пропонується використовувати
сучасний детектор – згорткову нейронну мережу YOLO та алгоритм відслідковування об’єктів – DeepSORT, що використовує класичні підходи фільтрування вхідних даних та прогнозування положення об’єкта у просторі а також сучасну нейронну мережу, що здатна розрізняти зовнішність людей. В результаті даної роботи, серед безкоштовних аналогів в мережі інтернет, було досягнуто прискорення розмиття облич до 20%, що є досить непоганим результатом.

Бібл. 8, іл. 10, табл. 3

Посилання

A. Bewley, Z. Ge, L. Ott, F. Ramos and B. Upcroft, "Simple online and realtime tracking," 2016 IEEE International Conference on Image Processing (ICIP), Phoenix, AZ, USA, 2016, pp. 3464-3468, doi: 10.1109/ICIP.2016.7533003.

Zewen Li, Wenjie Yang, Shouheng Peng, & Fan Liu. (2020). A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects. URL: https://arxiv.org/ftp/arxiv/papers/2004/2004.02806.pdf

Xingxing Xie, Gong Cheng, Jiabao Wang, Xiwen Yao, & Junwei Han. (2021). Oriented R-CNN for Object Detection. URL: https://www.arxiv-vanity.com/papers/2108.05699/

Joseph Redmon, Santosh Divvala, Ross Girshick, & Ali Farhadi. (2016). You Only Look Once: Unified, Real-Time Object Detection. URL: https://arxiv.org/pdf/1506.02640.pdf

Priya D. YOLOv5 compared to Faster RCNN. Who wins? URL: https://towardsdatascience.com/yolov5-compared-to-faster-rcnn-who-wins-a771cd6c9fb4

Nicolai Wojke, Alex Bewley, & Dietrich Paulus. (2017). Simple Online and Realtime Tracking with a Deep Association Metric. URL: https://arxiv.org/pdf/1703.07402.pdf

McLachlan, G.J. Mahalanobis distance. Reson 4, 20–26 (1999). https://doi.org/10.1007/BF02834632

Yan Pei, Swarnendu Biswas, Donald S. Fussell, Keshav Pingali. (2019). An Elementary Introduction to Kalman filtering URL: https://arxiv.org/pdf/1710.04055.pdf

##submission.downloads##

Опубліковано

2024-04-23