Система розпізнавання та аналітики проросійської пропаганди на базі моделі текстової класифікації та методів статистичної обробки даних
DOI:
https://doi.org/10.20535/1560-8956.42.2023.278923Ключові слова:
нейронні мережі, класифікація тексту, текстові трансформери, новини, пропаганда, хештеги, мережі, Telegram, TwitterАнотація
Об’єктом дослідження є обробка текстових даних у контексті розпізнавання та аналітики проросійської пропаганди. У даній статті розглянуті основні методи та існуючі підходи щодо класифікації тексту та особливості класифікації пропаганди. Метою дослідження є розробка нової системи на базі нейронних мереж, що вміє як визначати політичну полярність переданих джерел повідомлень, так і будувати різноманітну аналітику на основі зібраних даних, що стосуються українсько-російської війни. Для досягнення мети пропонується класифікаційна модель на базі текстового
трансформера BERT, що здатна класифікувати тексти з більшою точністю ніж класичні аналоги та ряд алгоритмів, що використовують розроблену класифікаційну модель, для побудови різноманітних представлень.
Бібл. 19, іл. 4, табл. 1
Посилання
Суспільно-політичні настрої населення України: результати опитування, проведеного 9-17 грудня 2021 року методом особистих (“face-to-face”) інтерв’ю. URL: https://www.kiis.com.ua/?lang=ukr&cat=reports&id=1080&page=1
Драбюк С.С. Пропаганда та її види. Шляхи протидії пропаганді. // Аналітично-порівняльне правознавство. – 2022. – №1. – с. 153-157. https://doi.org/10.24144/2788-6018.2022.01.28
Shymkovych V., Telenyk S., Kravets P. Hardware implementation of radial-basis neural networks with Gaussian activation functions on FPGA. // Neural Computing and Applications. – 2021. – 33(15): 9467-9479. https://doi.org/10.1007/s00521 -021-05706-3
Dreyfus G. Neural Networks: Methodology and Applications. // Springer-Verlag, Berlin. – 2005. – 498 p. https://doi.org/10.1007/3-540-28847-3
Kravets P., Nevolko P., Shymkovych V., Shymkovych L. Synthesis of High-Speed Neuro-Fuzzy-Controllers Based on FPGA. // 2020 IEEE 2nd International Conference on Advanced Trends in Information Theory (ATIT). – 2020. – 291-295. https://doi.org/10.1109/ATIT50783.2020.9349299
Bezliudnyi Y., Shymkovysh V., Doroshenko A. Convolutional neural network model and software for classification of typical pests. // Prombles in programming. – 2021. – 4: 95-102. https://doi.org/10.15407/pp2021.04.095
Bouvier M., Valentian A., Mesquida T., Rummens F., Reyboz M., Vianello E., Beigne E. Spiking neural networks hardware implementations and challenges: a survey. // ACM Journal on Emerging Technologies in Computing Systems. – 2019. – 15:22. https://doi.org/10.1145/3041033
Gonçalves S., Cortez P., Moro S. A deep learning classifier for sentence classification in biomedical and computer science abstracts. // Neural Computing and Applications. – 2020. – 32: 6793–6807. https://doi.org/10.1007/s00521 -019-04334-2
Rao A., Spasojevic N. Actionable and Political Text Classification using Word Embeddings and LSTM.// arXiv:1607.02501 – 2016. – 9 p.
https://doi.org/10.48550/arXiv.1607.02501
Geovany I., Arturo J. A sentiment analysis of the Ukraine-Russia conflict tweets using Recurrent Neural Networks.– 2022. – 5 p.
VADER-Sentiment-Analysis. URL: https://github.com/cjhutto/vaderSentiment.
Vaswani A., Shazeer N., Parmar N., Uszkoreit J. Attention Is All You Need. // arXiv:1706.03762 – 2021. – 15 p. https://doi.org/10.48550/arXiv.1706.03762
Devlin J., Chang M., Lee K., Toutanova K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. // arXiv:1810.04805– 2018. – 16 p. https://doi.org/10.48550/arXiv.1810.04805
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.