Застосування вкладених представлень для класифікації з опціональною розширюваністю

Автор(и)

  • Ф. Смілянець КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.45.2024.313198

Ключові слова:

мультикласова класифікація, згорткові нейронні мережі, вкладені представлення, класифікація на основі вкладених представлень, класифікація зображень

Анотація

У даному дослідженні розглянуто можливість побудови розширюваного методу класифікації зображень із використанням згорткової нейронної мережі генерації вкладених представлень для подальшого використання з простішими алгоритмами машинного навчання. Можливість використання цього підходу для додавання нових класів шляхом додаткового навчання без зміни топології мережі векторизації була продемонстрована на двох наборах даних: MNIST та Fashion-MNIST. Для цього було навчено звичайну класифікаційну згорткову нейронну мережу на обох наборах даних з використанням перших трьох класів. Відповідні натреновані мережі були модифіковані для генерації вкладених представлень. Додаткові шари для генерації ембеддингів в обох мережах були натреновані з використанням триплетної функції втрат з метою видобування ознак з виходу згорткових шарів, при цьому зберігаючи розрізнення між класами. Декілька простіших алгоритмів машинного навчання були натреновані для класифікації на основі отриманих вкладених представлень. Для перевірки гіпотези розширюваності, до навчальних наборів мереж було додано четвертий клас, мережі дотреновано та інші алгоритми навчено з нуля. Було виміряно точність класифікації на основі вкладених представлень мереж з 3 та 4 класами. Додатково було проведено аналіз витрат часу для звичайних класифікаційних мереж і запропонованого методу. Результати дослідження свідчать про те, що цей підхід може зменшити час і складність повторного навчання, особливо для більш складних завдань класифікації зображень, а також пропонує додаткові можливості, такі як пошук схожості у векторних базах даних. Однак для простіших завдань звичайні класифікаційні мережі залишаються більш ефективними з точки зору часу.

Бібл. 8, іл. 4, таб. 2.

Посилання

Breiman L. Random forests / L. Breiman // Machine Learning. – 2001. – Vol. 45, No. 1. – P. 5–32.

Cunningham P. K-nearest neighbour classifiers - a tutorial / P. Cunningham, S. J. Delany // ACM Computing Surveys. – 2022. – Vol. 54, No. 6. – P. 1–25.

LeCun Y. The mnist database of handwritten digits / Y. LeCun, C. Cortes, C. J. C. Burges. – 1998.

Xiao H. Fashion-mnist: a novel image dataset for benchmarking machine learning algorithms / H. Xiao, K. Rasul, R. Vollgraf // 2017.

Rahimzadeh M. A fully automated deep learning-based network for detecting covid-19 from a new and large lung ct scan dataset / M. Rahimzadeh, A. Attar, S. M. Sakhaei // Biomedical Signal Processing and Control. – 2021. – Vol. 68. – P. 102588.

Lin T.-Y. Feature pyramid networks for object detection / T.-Y. Lin, P. Dollár, R. Girshick, [et al.]. – 2017.

Kelcey M. Metric learning for image similarity search / M. Kelcey. – 2020.

Hoffer E. Deep metric learning using triplet network / E. Hoffer, N. Ailon. – 2018.

##submission.downloads##

Опубліковано

2024-10-15