Підвищення точності семантичної сегментації на основі примусового виокремлення контурів
DOI:
https://doi.org/10.20535/1560-8956.35.2019.197435Ключові слова:
мережі глибокого навчання, U-Net, FPN, семантична сегментація, оператор Собеля.Анотація
В прикладних задачах аналізу зображень семантична сегментація є однією з
найпоширеніших. Основною проблемою семантичної сегментації на мережах глибокого навчання є втрата піксельної точності при обробці зображень на нижніх шарах енкодера. Це особливо суттєво на границях об’єктів. В деяких прикладних задачах така точність має надважливе значення, наприклад, при діагностиці патологій на основі медичних знімків. В статті запропоновано спосіб підвищення точності семантичної сегментації завдяки модифікації
нейронних мереж глибокого навчання примусовим визначенням контурів оператором Собеля.
Представлено модифікацію нейронних мереж архітектур U-Net та FPN. Приведено постановку обчислювальних експериментів та результати їх проведення. Експериментально доведено ефективність запропонованого способу.
Бібл. 16, іл. 1, табл. 2
Посилання
V. Badrinarayanan, A. Kendall, and R. Cipolla, "Segnet: A deep convolutional encoder-decoder architecture for image segmentation" arXiv:1511.00561, 2015.
Ronneberger, O., Fischer, P., Brox, T.: U-net: Convolutional networks for biomedical image segmentation. In: MICCAI. LNCS, vol. 9351, pp. 234–241. Springer (2015)
T.-Y. Lin, P. Dollár, R. Girshick, K. He, B. Hariharan, and S. Belongie. Feature pyramid networks for object detection. arXiv preprint arXiv:1612.03144, 2016. 3
Iglovikov V., Shvets A. TernausNet: U-Net with VGG11 Encoder PreTrained on ImageNet for Image Segmentation. arXiv: 1801.05746, 2018
Apache MXNet. URL: https://mxnet.apache.org
Keras. URL: https://keras.io/
TensorFlow. URL: https://www.tensorflow.org/
PyTorch. URL: https://pytorch.org/
Hu J., Shen L., Sun G. Squeeze-and-Excitation Networks. arXiv: Computer Sience. 2017. 5 September. 11 p.
URL: https://arxiv.org/pdf/1709.01507v1.pdf
O. Oktay, J. Schlemper, L. L. Folgoc, M. Lee, M. Heinrich, K. Misawa, K. Mori, S. McDonagh, N. Y. Hammerla, B. Kainz et al., “Attention U-Net: Learning Where to Look for the Pancreas,” arXiv preprint arXiv:1804.03999, 2018.
Kaggle. URL: https://www.kaggle.com/
S. Das, "Comparison of Various Edge Detection Technique", International Journal of Signal Processing. Image Processing and Pattern Recognition, vol. 9, no. 2, (2016), pp. 143-158.
Segmentation Models.
URL: https://github.com/qubvel/segmentation_models
TGS Salt Identification Challenge. Segment salt deposits beneath the
Earth's surface.
URL: https://www.kaggle.com/c/tgs-salt-identification-challenge
Cityscapes Dataset. URL: https://www.cityscapes-dataset.com/
Cityscapes Image Pairs.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.