Моделі для аналізу успішності стартапів та прогнозування їх виживання на ринку
DOI:
https://doi.org/10.20535/1560-8956.46.2025.323889Ключові слова:
інтелектуальний аналіз даних, модель прогнозування, k-nearest neighbors, decision tree, gradient boosting, random forest, метрики точностіАнотація
Робота присвячена аналізу та прогнозуванню успішності стартапів. Метою є виявлення факторів, що впливають на можливості фінансування старапу, а також розробка моделей для прогнозування його успіху і майбутніх тенденцій. У роботі проведено ґрунтовний аналіз історичних даних стартапів з різних країн, їх показники фінансування та пройдені віхи розвитку. Дослідження базувалось на даних за більш ніж 100 років. Для прогнозування виживання стартапів на ринку обрано чотири моделі: Random Forest, k-Nearest Neighbors (kNN), Decision Tree та Gradient Boosting. Основною метрикою для визначення точності моделі у цьому дослідженні є зважена F-міра. На основі отриманих результатів можна зробити висновок, що найоптимальнішим методом для прогнозування успішності стартапу є модель Random Forest, хоча й інші моделі дали не набагато гірший результат. Аналіз факторів, що впливають на успішність стартапів, є критично важливим для розробки стратегій їх підтримки та розвитку. Отримані результати можуть бути використані як інвесторами, так і самими компаніями для прийняття більш обґрунтованих рішень та розробки ефективних стратегій. Очікується, що результати дослідження дозволять отримати глибше розуміння майбутніх перспектив цих
компаній.
Бібл. 9, іл. 13, табл. 1
Посилання
Startup Investor Academy. [Електронний ресурс] – URL: https://www.startupinvestoracademy.com/
Kaggle Learn. [Електронний ресурс] – URL: https://www.kaggle.com/datasets/justinas/startup-investments
Seaborn: statistical data visualization. [Електронний ресурс] – URL: https://seaborn.pydata.org/
Pandas documentation – pandas 2.2.2 documentation. pandas - Python Data Analysis Library. [Електронний ресурс] – URL: https://pandas.pydata.org/docs/
Т. А. Ліхоузова, Теорія імовірностей та математична статистика – 2018, КПІ ім. Ігоря Сікорського. [Електронний ресурс] – URL: https://ela.kpi.ua/handle/123456789/23168
Rajender Kumar, Mastering Data Analysis with Python. – Jamba Academy, 2023.
Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning – Springer, 2017.
Steven S. Skiena, The Data Science Design Manual – Springer, 2017.
Tomas Hrycej, Bernhard Bermeitinger, Matthias Cetto, Siegfried Handschuh, Mathematical Foundations of Data Science – Springer, 2017.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.