Система розпізнавання та аналітики проросійської пропаганди на базі моделі текстової класифікації та методів статистичної обробки даних

Автор(и)

  • Ю. Безлюдний КПІ ім. Ігоря Сікорського, Україна
  • В. Шимкович КПІ ім. Ігоря Сікорського, Україна
  • П. Кравець КПІ ім. Ігоря Сікорського, Україна
  • A. Новацький КПІ ім. Ігоря Сікорського, Україна
  • Л. Шимкович КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.42.2023.278923

Ключові слова:

нейронні мережі, класифікація тексту, текстові трансформери, новини, пропаганда, хештеги, мережі, Telegram, Twitter

Анотація

Об’єктом дослідження є обробка текстових даних у контексті розпізнавання та аналітики проросійської пропаганди. У даній статті розглянуті основні методи та існуючі підходи щодо класифікації тексту та особливості класифікації пропаганди. Метою дослідження є розробка нової системи на базі нейронних мереж, що вміє як визначати політичну полярність переданих джерел повідомлень, так і будувати різноманітну аналітику на основі зібраних даних, що стосуються українсько-російської війни. Для досягнення мети пропонується класифікаційна модель на базі текстового
трансформера BERT, що здатна класифікувати тексти з більшою точністю ніж класичні аналоги та ряд алгоритмів, що використовують розроблену класифікаційну модель, для побудови різноманітних представлень.

Бібл. 19, іл. 4, табл. 1

Посилання

Суспільно-політичні настрої населення України: результати опитування, проведеного 9-17 грудня 2021 року методом особистих (“face-to-face”) інтерв’ю. URL: https://www.kiis.com.ua/?lang=ukr&cat=reports&id=1080&page=1

Драбюк С.С. Пропаганда та її види. Шляхи протидії пропаганді. // Аналітично-порівняльне правознавство. – 2022. – №1. – с. 153-157. https://doi.org/10.24144/2788-6018.2022.01.28

Shymkovych V., Telenyk S., Kravets P. Hardware implementation of radial-basis neural networks with Gaussian activation functions on FPGA. // Neural Computing and Applications. – 2021. – 33(15): 9467-9479. https://doi.org/10.1007/s00521 -021-05706-3

Dreyfus G. Neural Networks: Methodology and Applications. // Springer-Verlag, Berlin. – 2005. – 498 p. https://doi.org/10.1007/3-540-28847-3

Kravets P., Nevolko P., Shymkovych V., Shymkovych L. Synthesis of High-Speed Neuro-Fuzzy-Controllers Based on FPGA. // 2020 IEEE 2nd International Conference on Advanced Trends in Information Theory (ATIT). – 2020. – 291-295. https://doi.org/10.1109/ATIT50783.2020.9349299

Bezliudnyi Y., Shymkovysh V., Doroshenko A. Convolutional neural network model and software for classification of typical pests. // Prombles in programming. – 2021. – 4: 95-102. https://doi.org/10.15407/pp2021.04.095

Bouvier M., Valentian A., Mesquida T., Rummens F., Reyboz M., Vianello E., Beigne E. Spiking neural networks hardware implementations and challenges: a survey. // ACM Journal on Emerging Technologies in Computing Systems. – 2019. – 15:22. https://doi.org/10.1145/3041033

Gonçalves S., Cortez P., Moro S. A deep learning classifier for sentence classification in biomedical and computer science abstracts. // Neural Computing and Applications. – 2020. – 32: 6793–6807. https://doi.org/10.1007/s00521 -019-04334-2

Rao A., Spasojevic N. Actionable and Political Text Classification using Word Embeddings and LSTM.// arXiv:1607.02501 – 2016. – 9 p.

https://doi.org/10.48550/arXiv.1607.02501

Geovany I., Arturo J. A sentiment analysis of the Ukraine-Russia conflict tweets using Recurrent Neural Networks.– 2022. – 5 p.

VADER-Sentiment-Analysis. URL: https://github.com/cjhutto/vaderSentiment.

Vaswani A., Shazeer N., Parmar N., Uszkoreit J. Attention Is All You Need. // arXiv:1706.03762 – 2021. – 15 p. https://doi.org/10.48550/arXiv.1706.03762

Devlin J., Chang M., Lee K., Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. // arXiv:1810.04805– 2018. – 16 p. https://doi.org/10.48550/arXiv.1810.04805

##submission.downloads##

Опубліковано

2023-05-01