Архітектура програмного забезпечення для створення психологічного портрету людини на основі активності в соціальних мережах
DOI:
https://doi.org/10.20535/1560-8956.46.2025.323690Ключові слова:
психологічний портрет, соціальні мережі, великі мовні моделі, нейронні мережі, обробка природньої мови, визначення персональних якостейАнотація
В даній роботі було розроблено та реалізовано архітектуру програмного забезпечення для створення психологічного портрету людини на основі активності в соціальних мережах. Сучасна людина велику кількість часу проводить в соціальних мережах та залишає там цифровий слід який сильно корелює з її психологічними особливостями. На основі даних з соціальних мереж можна зрозуміти патерни поведінки, тип темпераменту людини тощо. Метою даного дослідження є автоматизація побудови психологічного портрету людини на основі активності в соціальних мережах. Дана робота фокусується на використанні підходу моделей особистості для формалізації психологічного портрету, а саме Big Five та Myers-Briggs Type Indicator (MBTI). Згідно з цим було розроблено математичну постановку задачі. Відповідно до створеної постановки дану задачу було формалізовано як задачу багато міткової класифікації і використано нейромережевий підхід для її вирішення. Вибір архітектури зупинився на використанні великих мовних моделей. Дана архітектура на момент написання статті показує найращі результати на більшості задач обробки природньої мови задач. В якості архітектури було обрано архітектуру Large Language Model Meta AI. Науковою новизною є використання підходу multitask finetuning для цієї задачі. Було побудовано instruction tuning датасети на основі датасетів «Essays I» та «MBTI Dataset». В результаті дослідження було доведено що використання цього підходу дозволяє значно покращити результати моделі в порівнянні з тренуванням на кожній із задач окремо. Спроектовано та реалізовано розподілену архітектуру для аналізу постів в соціальних мережах. Подальша робота включає вдосконалення точності нейронної мережі за рахунок збору більшої кількості даних та введенні механізмів зворотного зв’язку. Наведено варіанти використання системи та її обмеження. Результати цього дослідження мають важливе значення для таких сфер діяльності як підбір персоналу, маркетинг або криміналістика.
Бібл. 15, іл. 8, табл. 1
Посилання
Mariam Hassanein; Sherine Rady; Wedad Hussein; Tarek F. Gharib. «Predicting Big Five Personality Traits Using Social Media Activity», in Tenth International Conference on Intelligent Computing and Information Systems (ICICIS), pp. 160-164, Cairo, Egypt, 2021. DOI: 10.1109/ICICIS52592.2021.9694160.
Anggit Dwi Hartanto, Ema Utami, Kusrini, Arief Setyanto, «A Survey of Semantic Approaches in Personality Traits Profiling Analysis», International Conference on Smart Computing, IoT and Machine Learning (SIML), pp. 35-42, 2024. DOI:10.1109/SIML61815.2024.10578100.
Davide Marengo, Christian Montag, «Digital Phenotyping of Big Five Personality via Facebook Data Mining: A Meta-Analysis», Digital Psychology 1(1), pp. 52-64, 2020. DOI: 10.24989/dp.v1i1.1823.
Jyoti Yadav, «Sentiment Analysis on Social Media», Qeios, pp. 1-10, 2023. DOI:10.32388/YF9X04.
Muskan Goyal, Prachi Tawde, « A research attempt to predict and model personalities through users’ social media details», 2022 IEEE Bombay Section SignatureConference (IBSSC), pp.1-6, 2022. DOI: 10.1109/IBSSC56953.2022.10037272.
Kelvin Kelvin, Yesun Utomo, «Overview of Text Based Personality Prediction Using Deep Learning», Engineering MAthematics and Computer Science (EMACS) Journal 6(2), pp. 93-100, 2024. DOI: 10.21512/emacsjournal.v6i2.11550.
Sergii Telenyk, Grzegorz Nowakowski, Olena Gavrilenko, Mykhailo Miahkyi and Olena Khalus, «An analysis of the influence of famous people’s posts on social networks on the cryptocurrency exchange rate», Bulletin of the Polish Academy of Sciences Technical Sciences, Vol. 72(4), pp. 1-9^ 2024, Article number: e150117 DOI: 10.24425/bpasts.2024.150117
G. Boyle. «Myers-Briggs Type Indicator (MBTI): Some psychometric limitations», in Humanities & Social Sciences papers, vol. 30, 1995. pp. 71–74. DOI: https://doi.org/10.1111/j.1742-9544.1995.tb01750.x.
N. Sangwan. «Exploring the Big Five Theory: Unveiling the Dynamics and Dimensions of Personality», in Sports Science & Health Advances, vol. 1, pp. 73–77, 2023. DOI: https://doi.org/10.60081/SSHA.1.2.2023.73-77.
J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova. «BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding», arXiv.org, 2019. DOI: https://doi.org/10.48550/arXiv.1810.04805.
Tom B. Brown et al. «Language Models are Few-Shot Learners», arXiv.org,2020. P. 73. DOI: https://doi.org/10.48550/arXiv.2005.14165.
H. Touvron et al. «LLaMA: Open and Efficient Foundation Language Models», arXiv.org, 2023. DOI: https://doi.org/10.48550/arXiv.2302.13971.
Jianlin Su et al. «RoFormer: Enhanced transformer with Rotary Position Embedding», in Neurocomputing, vol. 568, P. 127063, 2024. DOI: https://doi.org/10.1016/j.neucom.2023.127063.
N. Shazeer. «GLU Variants Improve Transformer», arXiv.org 2020. DOI: https://doi.org/10.48550/arXiv.2002.05202.
E. J. Hu et al. «LoRA: Low-Rank Adaptation of Large Language Models», arXiv.org, 2021. DOI: https://doi.org/10.48550/arXiv.2106.09685.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.