Сучасні технології приховування облич людей за допомогою object tracking на базі YOLOv5 та DeepSort
DOI:
https://doi.org/10.20535/1560-8956.44.2024.302439Ключові слова:
нейронна мережа, знаходження об’єктів, розпізнавання об’єктів, детектор, YOLO, DeepSORT, Фільтр КалманаАнотація
Об’єктом дослідження є система автоматизованого розмиття людських облич на відео. В даній статті зроблений детальний огляд сучасних технології та принципів відслідковування об’єктів на відео з присвоюванням їм елементів унікальності. Так як наразі більшість відео редакторів все рівно більшу частину роботи залишають користувачеві, було вирішено провести оптимізацію даного процесу. Метою даної роботи є зниження часових витрат на виконання процесу приховування людських облич на відеофайлах. Для досягнення такої цілі пропонується використовувати
сучасний детектор – згорткову нейронну мережу YOLO та алгоритм відслідковування об’єктів – DeepSORT, що використовує класичні підходи фільтрування вхідних даних та прогнозування положення об’єкта у просторі а також сучасну нейронну мережу, що здатна розрізняти зовнішність людей. В результаті даної роботи, серед безкоштовних аналогів в мережі інтернет, було досягнуто прискорення розмиття облич до 20%, що є досить непоганим результатом.
Бібл. 8, іл. 10, табл. 3
Посилання
A. Bewley, Z. Ge, L. Ott, F. Ramos and B. Upcroft, "Simple online and realtime tracking," 2016 IEEE International Conference on Image Processing (ICIP), Phoenix, AZ, USA, 2016, pp. 3464-3468, doi: 10.1109/ICIP.2016.7533003.
Zewen Li, Wenjie Yang, Shouheng Peng, & Fan Liu. (2020). A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects. URL: https://arxiv.org/ftp/arxiv/papers/2004/2004.02806.pdf
Xingxing Xie, Gong Cheng, Jiabao Wang, Xiwen Yao, & Junwei Han. (2021). Oriented R-CNN for Object Detection. URL: https://www.arxiv-vanity.com/papers/2108.05699/
Joseph Redmon, Santosh Divvala, Ross Girshick, & Ali Farhadi. (2016). You Only Look Once: Unified, Real-Time Object Detection. URL: https://arxiv.org/pdf/1506.02640.pdf
Priya D. YOLOv5 compared to Faster RCNN. Who wins? URL: https://towardsdatascience.com/yolov5-compared-to-faster-rcnn-who-wins-a771cd6c9fb4
Nicolai Wojke, Alex Bewley, & Dietrich Paulus. (2017). Simple Online and Realtime Tracking with a Deep Association Metric. URL: https://arxiv.org/pdf/1703.07402.pdf
McLachlan, G.J. Mahalanobis distance. Reson 4, 20–26 (1999). https://doi.org/10.1007/BF02834632
Yan Pei, Swarnendu Biswas, Donald S. Fussell, Keshav Pingali. (2019). An Elementary Introduction to Kalman filtering URL: https://arxiv.org/pdf/1710.04055.pdf
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.