Порівняння способів збереження слів в ІТ

Автор(и)

  • Юрій Іванович Кисленко доцент кафедри технічної кібернетики, ФІОТ НТУУ «КПІ», к.т.н., сфера наукових досліджень – структурна організація мови, інформаційні природно-мовні технології, нейрофізіологія сенсорних систем, штучний інтелект,
  • Данило Сергійович Сергеєв аспірант кафедри технічної кібернетики ФІОТ НТУУ «КПІ»,

DOI:

https://doi.org/10.20535/1560-8956.28.2016.82389

Ключові слова:

база даних, база знань, слово, природна мова, інформаційні природно-мовні технології

Анотація

У даній статті окреслено основні проблеми представлення природно-мовного слова у вигляді структурованого об'єкту даних. Для цього одночасно розглядається слово – як об'єкт, структура якого може бути представлена на різних рівнях деталізації, від послідовності символів до елементу загальної концептуальної мережі та способи його збереження – як різні рівні практичної реалізації такого об'єкту.

У першій частині статті виділено й обгрунтовано характерні особливості структури, що може адекватно представляти слово, та визначено відповідні загальні вимоги до способів його зберігання. На основі цього побудовано ієрархічну класифікацію способів представлення слова за рівнем деталізації опису об'єкта.

У другій частині статті для кожного з отриманих класів визначено переваги та недоліки, на основі чого запропоновано загальний напрям їх використання та надано приклади практичних задач, вирішення яких може бути оптимізоване за допомогою цих способів.

Посилання

Russom P. Big data analytics, TDWI best practices report / Philip Russom. – Renton, WA: TDWI Research, 2011. – 35 с.

Шнайер Б. Прикладная криптография. Протоколы, алгоритмы, исходные тексты на языке Си / Брюс Шнайер. – Москва: Триумф, 2002. – 816 с.

PostgreSQL Documentation. Full Text Search. Dictionaries [Електронний ресурс] / The PostgreSQL Global Development Group. – 2015. – Режим доступу до ресурсу: http://www.postgresql.org/docs/9.1/static/textsearch-dictionaries.html.

Henning K. Performance analysis of MySQL's FULLTEXT indexes and LIKE queries for full text search [Електронний ресурс] / Koch Henning. – 2013. – Режим доступу до ресурсу: http://makandracards.com/makandra/12813-performance-analysis-of-mysql-s-fulltext-indexes-and-like-queries-for-full-text-search.

Зализняк А. А. Грамматический словарь русского языка. Словоизменение / Андрей Анатольевич Зализняк. – Москва: Рус. яз., 1977.

Smiley D. Solr 1.4 Enterprise Search Server / D. Smiley, E. Pugh. – Birmingham: Packt Publishing Ltd, 2009. – 337 с.

Электронный словарь Мультитран [Електронний ресурс] – Режим доступу до ресурсу: http://www.multitran.ru/.

Collective Generation of Natural Image Descriptions / [P. Kuznetsova, V. Ordonez, B. Alexander C. et al.]. – Stony Brook, NY: Department of Computer Science, Stony Brook University, 2012.

WordNet, a lexical database of English [Електронний ресурс] – Режим доступу до ресурсу: https://wordnet.princeton.edu/.

##submission.downloads##