Визначення змістовних ознак тексту на основі аналізу зв’язків між лексичними одиницями

Автор(и)

  • О. В. Бісікало Вінницький національний технічний університет Хмельницьке шосе, 95, г. Вінниця, Україна, 21021, Ukraine
  • А. І. Лісовенко Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021, Ukraine
  • О. В. Яхимович Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021, Ukraine
  • С. С. Траченко Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021, Ukraine

Ключові слова:

лема, синсет, зв’язок, ключові слова, стоп-слово, елемент онтології, гіпероніми, кластер, DKPro, NLTK

Анотація

Визначено змістовні ознаки і характеристики англомовного тексту на основі дослідження зв’язків між лемами та синсетами, що розпізнано лінгвістичними пакетами. Результати у вигляді списків ключових слів, елементів онтологій та змістовних кластерів понять отримано на прикладі «Address by President of the Russian Federation 2013/2014». Проведене дослідження було здійснено за допомогою пакетів DKPro Core та NLTK. 

Біографії авторів

О. В. Бісікало, Вінницький національний технічний університет Хмельницьке шосе, 95, г. Вінниця, Україна, 21021

Доктор технічних наук, доцент

Кафедра автоматики та інформаційно-вимірювальної техніки

А. І. Лісовенко, Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021

Аспірант, Кафедра автоматики та інформаційно-вимірювальної техніки

О. В. Яхимович, Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021

Магістр, Кафедра автоматики та інформаційно-вимірювальної техніки

С. С. Траченко, Вінницький національний технічний університет «ВНТУ», Хмельницьке шосе, 95, м. Вінниця, Україна, 21021

Студент, Кафедра автоматики та інформаційно-вимірювальної техніки

Посилання

1. Bisikalo O. V. (2013). Formal'ni metody obraznoho analizu ta syntezu pryrodno-movnykh konstruktsij : monohrafiia [Formal methods imagery analysis and synthesis of natural language constructions: monograph]. Vinnitsa, VNTU, 316. ISBN 978-966-641-528-1.

2. Bisikalo O. V., Bohgach I. V. (2013). Formal'ne vvedennia obraznoho rivnia do tradytsijnoi linhvistychnoi triady morfolohiia–syntaksys–semantyka [The formal introduction of the traditional figurative linguistic triad morphology-syntax-semantics]. Bionics intelligence, 2 (81), 27-30 .

3. Bisikalo O. V, Yahimovich O. V.(2015). Metod vyznachennia kliuchovykh sliv anhlomovnoho tekstu na osnovi DKPro Core [The method of determining keywords at English text based on the DKPro Core]. Technology Audit and Reserves Production. Information Technology., Vol. 1 № 2 (21), 26-30.

4.Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/transcripts/6402.

5. Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/news/6889.

6. Matlack, Carol. (2014) To Understand Putin, Try Counting

His Words. Bloomberg Businessweek. Available at: http://www.bloomberg.com/bw/articles/2014-12-11/counting-how-many-times-putin-said-russia.

7. Natural Language Processing: Integration of Automatic and Manual Analysis. Darmstadt. Technischen Universität. 2014. Available at: http://tuprints.ulb.tu-darmstadt.de/4151/1/rec-thesis-final.pdf.

8. Steven Bird, Ewan Klein, Edward Loper. (2010) Natural

Language Processing with Python Analyzing Text with

the Natural Language Toolkit. O’Reilly.Available at: http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf.

9. Gurevych I, Muhlhauser M., Muller Ch., Steimle J., Weimer M.,

Zesch T. (2007) Darmstadt Knowledge Processing Repository Based on UIMA. Available at: https://www.ukp.tu-darmstadt.de/fileadmin/user_upload /Group_UKP/publikationen/2007/gldv-uima-ukp.pdf. – 21.04.2015.

10. Banerjee, Satanjeev and Pedersen, Ted. (2002). An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet. Lecture Notes In Computer Science, 2276, 136-145. ISBN 3-540-43219-1.

##submission.downloads##

Опубліковано

2015-06-02

Номер

Розділ

Автоматизація та управління механіко-технологічними системами та комплексами