Визначення змістовних ознак тексту на основі аналізу зв’язків між лексичними одиницями

О. В. Бісікало, А. І. Лісовенко, О. В. Яхимович, С. С. Траченко

Анотація


Визначено змістовні ознаки і характеристики англомовного тексту на основі дослідження зв’язків між лемами та синсетами, що розпізнано лінгвістичними пакетами. Результати у вигляді списків ключових слів, елементів онтологій та змістовних кластерів понять отримано на прикладі «Address by President of the Russian Federation 2013/2014». Проведене дослідження було здійснено за допомогою пакетів DKPro Core та NLTK. 


Ключові слова


лема; синсет; зв’язок; ключові слова; стоп-слово; елемент онтології; гіпероніми; кластер; DKPro; NLTK

Повний текст:

PDF

Посилання


1. Bisikalo O. V. (2013). Formal'ni metody obraznoho analizu ta syntezu pryrodno-movnykh konstruktsij : monohrafiia [Formal methods imagery analysis and synthesis of natural language constructions: monograph]. Vinnitsa, VNTU, 316. ISBN 978-966-641-528-1.

2. Bisikalo O. V., Bohgach I. V. (2013). Formal'ne vvedennia obraznoho rivnia do tradytsijnoi linhvistychnoi triady morfolohiia–syntaksys–semantyka [The formal introduction of the traditional figurative linguistic triad morphology-syntax-semantics]. Bionics intelligence, 2 (81), 27-30 .

3. Bisikalo O. V, Yahimovich O. V.(2015). Metod vyznachennia kliuchovykh sliv anhlomovnoho tekstu na osnovi DKPro Core [The method of determining keywords at English text based on the DKPro Core]. Technology Audit and Reserves Production. Information Technology., Vol. 1 № 2 (21), 26-30.

4.Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/transcripts/6402.

5. Address by President of the Russian Federation. Available at: http://eng.kremlin.ru/news/6889.

6. Matlack, Carol. (2014) To Understand Putin, Try Counting

His Words. Bloomberg Businessweek. Available at: http://www.bloomberg.com/bw/articles/2014-12-11/counting-how-many-times-putin-said-russia.

7. Natural Language Processing: Integration of Automatic and Manual Analysis. Darmstadt. Technischen Universität. 2014. Available at: http://tuprints.ulb.tu-darmstadt.de/4151/1/rec-thesis-final.pdf.

8. Steven Bird, Ewan Klein, Edward Loper. (2010) Natural

Language Processing with Python Analyzing Text with

the Natural Language Toolkit. O’Reilly.Available at: http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf.

9. Gurevych I, Muhlhauser M., Muller Ch., Steimle J., Weimer M.,

Zesch T. (2007) Darmstadt Knowledge Processing Repository Based on UIMA. Available at: https://www.ukp.tu-darmstadt.de/fileadmin/user_upload /Group_UKP/publikationen/2007/gldv-uima-ukp.pdf. – 21.04.2015.

10. Banerjee, Satanjeev and Pedersen, Ted. (2002). An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet. Lecture Notes In Computer Science, 2276, 136-145. ISBN 3-540-43219-1.


Пристатейна бібліографія ГОСТ


1. Бісікало О. В. Формальні методи образного аналізу та синтезу природно-мовних конструкцій : монографія [Текст] / О. В. Бісікало // – Вінниця : ВНТУ, 2013. – 316 с. – ISBN 978-966-641-528-1.

2. Бісікало О. В. Формальне введення образного рівня до традиційної лінгвістичної тріади морфологія–синтаксис–семантика [Текст]
/ О. В. Бісікало, І. В. Богач // Бионика интеллекта. – 2013. – № 2 (81). –
С. 27–30.

3. Бісікало О. В. Метод визначення ключових слів англомовного тексту на основі DKPro Core [Текст] / О. В. Бісікало, О. В. Яхимович // Технологический аудит и резервы производства: Информационные технологии. – 2015. –  Том 1, № 2(21). – С. 26–30.

4. Address by President of the Russian Federation [Electronic resource]. – Available at: \www/URL: http://en.kremlin.ru/events/president/news/19825. – 12.12.2013.

5. Address by President of the Russian Federation [Electronic resource]. – Available at: \www/URL: http://en.kremlin.ru/events/president/news/47173. – 04.12.2014.

6. Matlack, Carol. To Understand Putin, Try Counting His Words  [Electronic resource]. – Bloomberg Businessweek, December 11, 2014. – Available at: \www/URL: http://www.bloomberg.com/bw/articles/2014-12-11/counting-how-many-times-putin-said-russia.

7. Natural Language Processing: Integration of Automatic and Manual Analysis [Electronic resource]. – Technischen Universität Darmstadt, 2014. – Available at: \www/URL: http://tuprints.ulb.tu-darmstadt.de/4151/1/rec-thesis-final.pdf. – 21.04.2015.

8. Bird, Steven. Natural Language Processing with Python Analyzing Text with the Natural Language Toolkit [Electronic resource] / Steven Bird, Ewan Klein, Edward Loper. – O’Reilly, – 2010. Available at: \www/URL: http://victoria.lviv.ua/html/fl5/NaturalLanguageProcessingWithPython.pdf.

9. Gurevych, I. Darmstadt Knowledge Processing Repository Based on UIMA [Electronic resource] / I. Gurevych, M. Muhlhauser, Ch. Muller, J. Steimle, M. Weimer, T. Zesch. – February 9, 2007. – Available at: \www/URL: https://www.ukp.tu-darmstadt.de/fileadmin/user_upload/Group_UKP/publikationen/2007/gldv-uima-ukp.pdf. – 21.04.2015.

10. Banerjee, Satanjeev and Pedersen, Ted. An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet, Lecture Notes In Computer Science. – Vol. 2276, Pp. 136-145, 2002. – ISBN 3-540-43219-1.



Посилання

  • Поки немає зовнішніх посилань.




Copyright (c) 2015 О. В. Бісікало, А. І. Лісовенко, О. В. Яхимович, С. С. Траченко

Creative Commons License
Ця робота ліцензована Creative Commons Attribution 4.0 International License.

ISSN 2411-2828 (Online), ISSN 2411-2798 (Print)