Застосування вкладених представлень для класифікації з опціональною розширюваністю
DOI:
https://doi.org/10.20535/1560-8956.45.2024.313198Ключові слова:
мультикласова класифікація, згорткові нейронні мережі, вкладені представлення, класифікація на основі вкладених представлень, класифікація зображеньАнотація
У даному дослідженні розглянуто можливість побудови розширюваного методу класифікації зображень із використанням згорткової нейронної мережі генерації вкладених представлень для подальшого використання з простішими алгоритмами машинного навчання. Можливість використання цього підходу для додавання нових класів шляхом додаткового навчання без зміни топології мережі векторизації була продемонстрована на двох наборах даних: MNIST та Fashion-MNIST. Для цього було навчено звичайну класифікаційну згорткову нейронну мережу на обох наборах даних з використанням перших трьох класів. Відповідні натреновані мережі були модифіковані для генерації вкладених представлень. Додаткові шари для генерації ембеддингів в обох мережах були натреновані з використанням триплетної функції втрат з метою видобування ознак з виходу згорткових шарів, при цьому зберігаючи розрізнення між класами. Декілька простіших алгоритмів машинного навчання були натреновані для класифікації на основі отриманих вкладених представлень. Для перевірки гіпотези розширюваності, до навчальних наборів мереж було додано четвертий клас, мережі дотреновано та інші алгоритми навчено з нуля. Було виміряно точність класифікації на основі вкладених представлень мереж з 3 та 4 класами. Додатково було проведено аналіз витрат часу для звичайних класифікаційних мереж і запропонованого методу. Результати дослідження свідчать про те, що цей підхід може зменшити час і складність повторного навчання, особливо для більш складних завдань класифікації зображень, а також пропонує додаткові можливості, такі як пошук схожості у векторних базах даних. Однак для простіших завдань звичайні класифікаційні мережі залишаються більш ефективними з точки зору часу.
Бібл. 8, іл. 4, таб. 2.
Посилання
Breiman L. Random forests / L. Breiman // Machine Learning. – 2001. – Vol. 45, No. 1. – P. 5–32.
Cunningham P. K-nearest neighbour classifiers - a tutorial / P. Cunningham, S. J. Delany // ACM Computing Surveys. – 2022. – Vol. 54, No. 6. – P. 1–25.
LeCun Y. The mnist database of handwritten digits / Y. LeCun, C. Cortes, C. J. C. Burges. – 1998.
Xiao H. Fashion-mnist: a novel image dataset for benchmarking machine learning algorithms / H. Xiao, K. Rasul, R. Vollgraf // 2017.
Rahimzadeh M. A fully automated deep learning-based network for detecting covid-19 from a new and large lung ct scan dataset / M. Rahimzadeh, A. Attar, S. M. Sakhaei // Biomedical Signal Processing and Control. – 2021. – Vol. 68. – P. 102588.
Lin T.-Y. Feature pyramid networks for object detection / T.-Y. Lin, P. Dollár, R. Girshick, [et al.]. – 2017.
Kelcey M. Metric learning for image similarity search / M. Kelcey. – 2020.
Hoffer E. Deep metric learning using triplet network / E. Hoffer, N. Ailon. – 2018.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.