DOI: https://doi.org/10.20535/1560-8956.35.2019.197427

Відновлення таблиць з частково відсутніми даними

A. Stenin, V. Pasko, E. Melkumian, S. Stenin

Анотація


Проблема відновлення даних зустрічається в найрізноманітніших додатках статистичного аналізу. Найчастіше це пов'язано з проведенням анкетування в різноманітних сферах народного господарства. При заповненні анкети експертом конкретної предметної області іноді він може не відповісти на всі питання або з технічних причин (збій каналу зв'язку), або з особистих обставин (не може надати переваги одному критерію перед іншим). Дані опитування в багатьох випадках формуються у вигляді прямокутних бінарних таблиць, де стовпці (рядки) являють собою досліджувані змінні, яким відповідають бінарні числа (1,0) або ознаки ( + , -). Ця стаття присвячена аналізу і відновленню бінарних даних в тих випадках, коли в таблиці частина значень змінних за вказаними вище причин відсутня. Рішення даного завдання пропонується здійснювати на основі методу однорідних груп. Суть даного методу полягає в відшуканні в генеральній
сукупності бінарних даних однорідних груп суб'єктів опитування і визначенні приналежності суб'єкта опитування, у відповіді якого по одній з вище зазначених причин з'явився пропуск, до однієї з виділених однорідних груп. Даний метод добре працює при великих масивах бінарних даних з відносно невеликою кількістю пропусків, але, як і всі методи заповнення, володіє низкою зазначених вище недоліків і використовується там, де пропуски не мають критичного значення. В іншому випадку використовуються більш суворі методи, наприклад, методи моделювання з використанням функцій максимальної правдоподібності або байєсовських стратегій.

Бібл. 8, табл. 2


Ключові слова


метод анкетування; таблиця анкетування двійкових даних; однорідні групи даних; метод однорідних груп; відновлення відсутніх даних

Повний текст:

PDF (English)

Посилання


Aivazyan S. A., Enyukov I. S., Meshalkin L. D. Applied statistics. Fundamentals of modeling and primary data processing-M.: Finance and statistics. 1983.– 472p.

Zozulev A. V., Solntsev S. A. Marketing research: Theory, ethodology,

statistics: a tutorial.-Kyiv. Znannya, 2008. – 643p.

Doctorov B. Z. Post-Gallup poll technologies: To the 200th anniversary of public opinion polls in the United States // Sociological journal. 2005. №. 2. pp. 5-36.

Anderson T. Introduction to multivariate statistical analysis – M.: Fizmatgiz. 1963.– 499p.

Borovkov A. A. Mathematical statistics. M.: Science. 1984. –472p.

R. J. A. little, D. B. Rubin, Statistical analysis with missing data. – M.:

Finance and statistics. 198.1– 336p.

Kohren U. Methods of sample study. M.: Statistics.-1976. – 440p.

Gubsky A. N., Stenin A. A., Korchinsky V. M. Method of binary data recovery with omissions //System technologies - Dnipro: NMetAU, IVK "System Technologies",№1(96) 2015. – pp. 206-211.