Title:
Research of methods of automatic formation of associative and hierarchical portrait of the subject area
Начальная страница/First page:
Краткое описание:
В работе рассматриваются проблемы семантического моделирования, методики автоматизированного выявления иерархических, синонимических и ассоциативных связей из интернет-текстов и построение лингвостатистических портретов различных предметных областей. Исследование основано на гипотезе о том, что более общие термины имеют больше ассоциативных связей, а также о привлечении ассоциативных связей для определения значения, полный смысл которого выявляется с помощью контекстных окружений, что дает возможность автоматизации процесса разграничения значений и извлечения знаний из текстов. Решение проблемы строится на основе комплексного подхода, сочетающего методы статистики, корпусной лингвистики и дистрибутивной семантики, и реализуется в технологии, которая предполагает разработку лингвостатистических механизмов формирования ассоциативно-иерархического портрета предметной области (АИППО), представляющего собой словарь значимых терминов предметной области, элементы которого связаны ассоциативными и иерархическими связями.
Работы проводятся на основе анализа различных предметных областей, в частности – по автономным необитаемым подводным аппаратам (АНПА).
Short description:
The paper discusses the problems of semantic modeling techniques for automated detection of hierarchical, synonymous and associative relationships from online texts and the construction of linguistic and statistical portraits of various subject areas. The study is based on the hypothesis that the more general terms have more associative relations. The involvement of associative relationships for the definition of the full meaning is revealed by the context of the environments that gives you the ability to automate the process of differentiating between values and knowledge extraction from texts. The solution is based on an integrated approach that combines statistical methods, corpus linguistics and distributional semantics, and is implemented in a technology which involves the development of linguo-statistical mechanisms for the formation of associative-hierarchic portrait of the subject area (AHPSA), which is a dictionary of important terms of the subject area, elements of which are connected by the associative and hierarchical relationships.
Work is carried out on the basis of the analysis of different subject areas, in particular, Autonomous Unmanned Underwater Vehicle (AUUV).