Визначення змістовних ознак тексту на основі аналізу зв’язків між лексичними одиницями
Ключові слова:
лема, синсет, зв’язок, ключові слова, стоп-слово, елемент онтології, гіпероніми, кластер, DKPro, NLTKАнотація
Визначено змістовні ознаки і характеристики англомовного тексту на основі дослідження зв’язків між лемами та синсетами, що розпізнано лінгвістичними пакетами. Результати у вигляді списків ключових слів, елементів онтологій та змістовних кластерів понять отримано на прикладі «Address by President of the Russian Federation 2013/2014». Проведене дослідження було здійснено за допомогою пакетів DKPro Core та NLTK.
Посилання
1. Bisikalo O. V. (2013). Formal'ni metody obraznoho analizu ta syntezu pryrodno-movnykh konstruktsij : monohrafiia [Formal methods imagery analysis and synthesis of natural language constructions: monograph]. Vinnitsa, VNTU, 316. ISBN 978-966-641-528-1.
2. Bisikalo O. V., Bohgach I. V. (2013). Formal'ne vvedennia obraznoho rivnia do tradytsijnoi linhvistychnoi triady morfolohiia–syntaksys–semantyka [The formal introduction of the traditional figurative linguistic triad morphology-syntax-semantics]. Bionics intelligence, 2 (81), 27-30 .
3. Bisikalo O. V, Yahimovich O. V.(2015). Metod vyznachennia kliuchovykh sliv anhlomovnoho tekstu na osnovi DKPro Core [The method of determining keywords at English text based on the DKPro Core]. Technology Audit and Reserves Production. Information Technology., Vol. 1 № 2 (21), 26-30.
4.Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/transcripts/6402.
5. Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/news/6889.
6. Matlack, Carol. (2014) To Understand Putin, Try Counting
His Words. Bloomberg Businessweek. Available at: http://www.bloomberg.com/bw/articles/2014-12-11/counting-how-many-times-putin-said-russia.
7. Natural Language Processing: Integration of Automatic and Manual Analysis. Darmstadt. Technischen Universität. 2014. Available at: http://tuprints.ulb.tu-darmstadt.de/4151/1/rec-thesis-final.pdf.
8. Steven Bird, Ewan Klein, Edward Loper. (2010) Natural
Language Processing with Python Analyzing Text with
the Natural Language Toolkit. O’Reilly.Available at: http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf.
9. Gurevych I, Muhlhauser M., Muller Ch., Steimle J., Weimer M.,
Zesch T. (2007) Darmstadt Knowledge Processing Repository Based on UIMA. Available at: https://www.ukp.tu-darmstadt.de/fileadmin/user_upload /Group_UKP/publikationen/2007/gldv-uima-ukp.pdf. – 21.04.2015.
10. Banerjee, Satanjeev and Pedersen, Ted. (2002). An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet. Lecture Notes In Computer Science, 2276, 136-145. ISBN 3-540-43219-1.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2015 О. В. Бісікало, А. І. Лісовенко, О. В. Яхимович, С. С. Траченко

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.