Комбінований метод індексування у нереляційних базах даних

Автор(и)

  • В. Нікітін КПІ ім. Ігоря Сікорського
  • Є. Крилов
  • Я. Корнага
  • В. Анікін

DOI:

https://doi.org/10.20535/1560-8956.38.2021.232948

Ключові слова:

бази даних, реляційні бази даних, нереляційні бази даних, індексування, бінарні дерева, хешування

Анотація

Об’єктом дослідження є методи індексування у нереляційних базах даних. У статті був зроблений огляд основних методів індексування, які використовуються у найпоширеніших базах даних. Ця робота базується на основі огляду та аналізу літератури пов'язаної з оптимізацією баз даних. Більшість алгоритмів використовують бінарні дерева для індексування, але існують бази даних, які використовують алгоритм хешування. Хешовані індекси дають високу швидкість доступу до даних, але основною проблемою є колізії. Бінарні дерева не мають такої проблеми, але існують проблеми з великими розмірами індексів та неможливістю використовувати багатопоточность. Комбінований метод надає високу швидкість доступу до даних та менші розміри індексів. Головна мета роботи це адоптувати комбінований алгоритм для нереляційних баз даних у робочому середовищі зі зменшенням розмірів індексів та збільшенням швидкості доступу до даних. Для досягнення мети використовується комбінований метод індексування структури бінарного дерева та хешування. В якості практичної частини було проведено експеримент з порівняння структур даних B-дерева та розширеного хешування. В якості мови програмування використовувалася Java та сам дослід проходив з використанням лише оперативної пам’яті. Результати досліду показали доцільним продовжувати дослідження комбінованого методу індексування з використанням пам’яті жорсткого носія та впровадженням у вихідний код реально існуючої бази даних.

Бібл. 8, іл. 1, табл. 2

Посилання

Корнага Я. І. Методи моніторингу подій та обробки запитів в гетерогенних розподілених базах даних на основі векторно-матричних операцій : дис. канд техн. наук: 05.13.06 / Держ. ун-т телекомунікацій. - Київ, 2015.

Redmond E. Seven Databases in Seven Weeks, 2nd Edition – 358 p., Pragmatic Bookshelf, April, 2018. ISBN-13: 9781680502534.

Grd P., Baca M.. Analysis of B-tree data structure and its usage in computer forensics. URL: https://www.researchgate.net/publication/210381551_Analysis_of_Btree_data_structure_and_its_usage_in_computer_forensics.

Sumit Thakur. Hashing Algorithm And Its Techniques In DBMS. URL: https://whatisdbms.com/hashing-algorithm-and-its-techniques-in-dbms.

MongoDB: Hashed Indexes. URL: https://docs.mongodb.com/manual/core/indexhashed/.

Hongjun Lu, Yuet Yeung Ng, Zengping Tia. T-Tree or B-Tree: Main Memory Database Index Structure Revisited // 2000 IEEE Proceedings 11th Australasian Database Conference. ADC 2000 (Cat. No.PR00528). – IEEE, 2000.

Ohene-Kwofie D., J.Otoo E., Nimako G.. O2-Tree: A Fast Memory Resident Index for In-Memory Databases // 2012 IACSIT International Conference on Information and Knowledge Management (ICIKM 2012). - IACSIT, 2012.

Robert Sedgewick. Algorithms in Java, Third Edition, Parts 1-4: Fundamentals, Data Structures, Sorting, Searching: 3rd Edition – 768 p., Addison-Wesley, 23 July, 2003. ISBN-13 : 9780201361209.

##submission.downloads##

Опубліковано

2021-05-31