Відновлення таблиць з частково відсутніми даними

Автор(и)

  • A. Stenin Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine
  • V. Pasko Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine
  • E. Melkumian Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine
  • S. Stenin Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Ukraine

DOI:

https://doi.org/10.20535/1560-8956.35.2019.197427

Ключові слова:

метод анкетування, таблиця анкетування двійкових даних, однорідні групи даних, метод однорідних груп, відновлення відсутніх даних

Анотація

Проблема відновлення даних зустрічається в найрізноманітніших додатках статистичного аналізу. Найчастіше це пов'язано з проведенням анкетування в різноманітних сферах народного господарства. При заповненні анкети експертом конкретної предметної області іноді він може не відповісти на всі питання або з технічних причин (збій каналу зв'язку), або з особистих обставин (не може надати переваги одному критерію перед іншим). Дані опитування в багатьох випадках формуються у вигляді прямокутних бінарних таблиць, де стовпці (рядки) являють собою досліджувані змінні, яким відповідають бінарні числа (1,0) або ознаки ( + , -). Ця стаття присвячена аналізу і відновленню бінарних даних в тих випадках, коли в таблиці частина значень змінних за вказаними вище причин відсутня. Рішення даного завдання пропонується здійснювати на основі методу однорідних груп. Суть даного методу полягає в відшуканні в генеральній
сукупності бінарних даних однорідних груп суб'єктів опитування і визначенні приналежності суб'єкта опитування, у відповіді якого по одній з вище зазначених причин з'явився пропуск, до однієї з виділених однорідних груп. Даний метод добре працює при великих масивах бінарних даних з відносно невеликою кількістю пропусків, але, як і всі методи заповнення, володіє низкою зазначених вище недоліків і використовується там, де пропуски не мають критичного значення. В іншому випадку використовуються більш суворі методи, наприклад, методи моделювання з використанням функцій максимальної правдоподібності або байєсовських стратегій.

Бібл. 8, табл. 2





Посилання

Aivazyan S. A., Enyukov I. S., Meshalkin L. D. Applied statistics. Fundamentals of modeling and primary data processing-M.: Finance and statistics. 1983.– 472p.

Zozulev A. V., Solntsev S. A. Marketing research: Theory, ethodology,

statistics: a tutorial.-Kyiv. Znannya, 2008. – 643p.

Doctorov B. Z. Post-Gallup poll technologies: To the 200th anniversary of public opinion polls in the United States // Sociological journal. 2005. №. 2. pp. 5-36.

Anderson T. Introduction to multivariate statistical analysis – M.: Fizmatgiz. 1963.– 499p.

Borovkov A. A. Mathematical statistics. M.: Science. 1984. –472p.

R. J. A. little, D. B. Rubin, Statistical analysis with missing data. – M.:

Finance and statistics. 198.1– 336p.

Kohren U. Methods of sample study. M.: Statistics.-1976. – 440p.

Gubsky A. N., Stenin A. A., Korchinsky V. M. Method of binary data recovery with omissions //System technologies - Dnipro: NMetAU, IVK "System Technologies",№1(96) 2015. – pp. 206-211.

##submission.downloads##

Опубліковано

2020-03-01