Моделі для аналізу успішності стартапів та прогнозування їх виживання на ринку

Автор(и)

  • Д. Чорнобривець КПІ ім. Ігоря Сікорського, Україна
  • К. Сергійчук КПІ ім. Ігоря Сікорського, Україна
  • Т. Ліхоузова КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.46.2025.323889

Ключові слова:

інтелектуальний аналіз даних, модель прогнозування, k-nearest neighbors, decision tree, gradient boosting, random forest, метрики точності

Анотація

Робота присвячена аналізу та прогнозуванню успішності стартапів. Метою є виявлення факторів, що впливають на можливості фінансування старапу, а також розробка моделей для прогнозування його успіху і майбутніх тенденцій. У роботі проведено ґрунтовний аналіз історичних даних стартапів з різних країн, їх показники фінансування та пройдені віхи розвитку. Дослідження базувалось на даних за більш ніж 100 років. Для прогнозування виживання стартапів на ринку обрано чотири моделі: Random Forest, k-Nearest Neighbors (kNN), Decision Tree та Gradient Boosting. Основною метрикою для визначення точності моделі у цьому дослідженні є зважена F-міра. На основі отриманих результатів можна зробити висновок, що найоптимальнішим методом для прогнозування успішності стартапу є модель Random Forest, хоча й інші моделі дали не набагато гірший результат. Аналіз факторів, що впливають на успішність стартапів, є критично важливим для розробки стратегій їх підтримки та розвитку. Отримані результати можуть бути використані як інвесторами, так і самими компаніями для прийняття більш обґрунтованих рішень та розробки ефективних стратегій. Очікується, що результати дослідження дозволять отримати глибше розуміння майбутніх перспектив цих
компаній.

Бібл. 9, іл. 13, табл. 1

Посилання

Startup Investor Academy. [Електронний ресурс] – URL: https://www.startupinvestoracademy.com/

Kaggle Learn. [Електронний ресурс] – URL: https://www.kaggle.com/datasets/justinas/startup-investments

Seaborn: statistical data visualization. [Електронний ресурс] – URL: https://seaborn.pydata.org/

Pandas documentation – pandas 2.2.2 documentation. pandas - Python Data Analysis Library. [Електронний ресурс] – URL: https://pandas.pydata.org/docs/

Т. А. Ліхоузова, Теорія імовірностей та математична статистика – 2018, КПІ ім. Ігоря Сікорського. [Електронний ресурс] – URL: https://ela.kpi.ua/handle/123456789/23168

Rajender Kumar, Mastering Data Analysis with Python. – Jamba Academy, 2023.

Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning – Springer, 2017.

Steven S. Skiena, The Data Science Design Manual – Springer, 2017.

Tomas Hrycej, Bernhard Bermeitinger, Matthias Cetto, Siegfried Handschuh, Mathematical Foundations of Data Science – Springer, 2017.

##submission.downloads##

Опубліковано

2025-02-26