Введение 3
1. Теоретические основы прикладной лингвистики 5
1.1. Информационная модель фактов 5
1.2. Единицы смысла языка и речи 5
1.3. Технологии и процедуры автоматической обработки текста 7
1.3.1 Морфологический анализ слов 7
1.3.2 Семантико-синтаксический анализ 8
1.3.3 Концептуальный анализ текстов 9
1.3.4 Технология составления частотных словарей по корпусу текстов 9
Выводы по главе 1 11
2. Автоматическое извлечение фактов в программной системе ИСИДА-Т 12
2.1. Способы извлечения фактов из неструктурированного текста. Постановка задачи 17
2.2. Пример реализации предлагаемого подхода в системе ИСИДА-Т 18
2.3. Исходные данные для анализа 19
Выводы по главе 2 24
Заключение 25
Список использованной литературы 26
Читать дальше
Таким образом в данной работе нами рассмотрены теоретические моменты автоматического извлечения фактов из текстов и практический подход.
Предлагаемый подход извлечения фактов из текстов основывается на частичном синтаксическом анализе выделенных фрагментов текста под контролем ресурса знаний. Тестирование предлагаемого алгоритма извлечения фактов из неструктурированного текста показало значительное ускорение работы программы по сравнению с подходом, где извлечение было основано на поиске фрагментов текста, удовлетворяющих записанным на языке правил шаблонным конструкциям. Кроме того, процесс разработки и отладки алгоритма демонстрирует большую гибкость нового подхода, легкость дополнения и настраивания под новые задачи. Результаты анализа сохраняются в удобной форме, их можно использовать как основу для дальнейшей обработки текста.
Читать дальше
Александровский Д.А., Кормалев Д.А., КормалеваМ.С., КуршевЕ.П., Сулейманова Е.А., Трофимов И.В. Развитие средств аналитической обработки текста в системе ИСИДА-Т // Тр. Десятой нац. конф. по искусственному интеллекту с междунар. участием КИИ-2006, Обнинск, 25-28 сентября 2006 г.: В 3 т. — М.: Физматлит, 2006. — Т. 2. — С. 555—563.
Белоногов Г.Г., ГиляревскийР.С. и др. Развитие систем автоматической обработки текстовой информации// Нейрокомпьютеры: разработка,применение. – 2010, № 8.
Васильев В.Г., Кривенко М.П. Методы автоматизированной обработки текстов. – М.: ИПИРАН, 2008. – 301 с.
Кормалев Д.А., КуршевЕ.П., Сулейманова Е.А., Трофимов И.В.. Технология извлеченияинформации, из текстов, основанная на знаниях. Программные продукты и системы, 2009, №2
Кузнецов И.П. Механизмы обработки семантической информации. – М.: Наука, 1978. – 175 с.
Мельчук И.А. Опыт теории лингвистических моделей «Смысл ?Текст». – М., 1974 (2-е изд., 1999).
Сайт Проект ИСИДА.[Электронный ресурс]. URL: http://isida-t.ru/index.php?option=com_content
Соссюр Фердинанд де. Курс общей лингвистики. – М.: Прогресс, 1977. – 370 с.
Читать дальше