Введение....................................................................................................................4 1. Анализ предметной области....................................................................................6 1.1 Классические произведения как первичный объект историко-литературного изучения.....................................................................................................................6 1.2 Проблема восприятия художественного произведения.......................................6 1.3 Выбор сайта с базой классической и мировой литературой...............................7 1.4 Сравнение аналогов..................................................................................................8 1.4.1 TextAnalyst SDK – библиотека программных компонентов технологии анализа текста........................................................................................................................8 1.4.2 TextAhalyst 2.0 – персональная система автоматического анализа текста..........................................................................................................................9 1.4.3 TextReferent 1.0 – быстрый помощник в анализе текста.....................................10 1.5 Методы реализации алгоритма.................................................................................................................11 1.5.1 Нейронные сети......................................................................................................11 1.5.2 Компьютерная лингвистика..................................................................................16 1.5.2.1 Приложения компьютерной лингвистики...................................................17 1.5.2.2 Сложности моделирования естественного языка.......................................21 1.5.2.3 Общие этапы и модули обработки текстов................................................22 1.6 Выбор реализации алгоритма..............................................................................24 2. Реализация алгоритма автоматического краткого пересказа книг...................26 2.1 Выбор языка программирования..........................................................................26 2.2 Язык программирования C#.................................................................................27 2.2.1 История языка .......................................................................................................27 2.2.2 Особенности реализации.......................................................................................27 2.2.3 Сравнение с C/C++ и Java....................................................................................28 2.3 Разработка алгоритма на псевдокоде.................................................................34 3. Реализация программы........................................................................................35 Заключение...........................................................................................................37 Список использованной литературы............................................................................................................38 Приложения..........................................................................................................41

Разработка алгоритма автоматического формирования краткого пересказа электронных книг

дипломная работа
Программирование
40 страниц
72% уникальность
2022 год
44 просмотров
Гриненко, Н.
Эксперт по предмету «Программирование»
Узнать стоимость консультации
Это бесплатно и займет 1 минуту
Оглавление
Введение
Заключение
Список литературы
Введение....................................................................................................................4 1. Анализ предметной области....................................................................................6 1.1 Классические произведения как первичный объект историко-литературного изучения.....................................................................................................................6 1.2 Проблема восприятия художественного произведения.......................................6 1.3 Выбор сайта с базой классической и мировой литературой...............................7 1.4 Сравнение аналогов..................................................................................................8 1.4.1 TextAnalyst SDK – библиотека программных компонентов технологии анализа текста........................................................................................................................8 1.4.2 TextAhalyst 2.0 – персональная система автоматического анализа текста..........................................................................................................................9 1.4.3 TextReferent 1.0 – быстрый помощник в анализе текста.....................................10 1.5 Методы реализации алгоритма.................................................................................................................11 1.5.1 Нейронные сети......................................................................................................11 1.5.2 Компьютерная лингвистика..................................................................................16 1.5.2.1 Приложения компьютерной лингвистики...................................................17 1.5.2.2 Сложности моделирования естественного языка.......................................21 1.5.2.3 Общие этапы и модули обработки текстов................................................22 1.6 Выбор реализации алгоритма..............................................................................24 2. Реализация алгоритма автоматического краткого пересказа книг...................26 2.1 Выбор языка программирования..........................................................................26 2.2 Язык программирования C#.................................................................................27 2.2.1 История языка .......................................................................................................27 2.2.2 Особенности реализации.......................................................................................27 2.2.3 Сравнение с C/C++ и Java....................................................................................28 2.3 Разработка алгоритма на псевдокоде.................................................................34 3. Реализация программы........................................................................................35 Заключение...........................................................................................................37 Список использованной литературы............................................................................................................38 Приложения..........................................................................................................41
Читать дальше
Актуальность данной темы заключается в том, что литература занимает значимое значение в жизни человека. Как вид искусства художественная литература возникла на почве мифологии и устного поэтического творчества в Древней Греции и Древнем Риме в I в. до н.э. Художественная литература хранит, накапливает и передает от поколения к поколению эстетические, нравственные, социально – культурные ценности. Особенно значима роль художественной литературы как средства познания мира человеческих отношений и в этом смысле она для читающего человека является источником образования и воспитания. Своеобразие влияния художественной литературы на людей определяется ее основной особенностью – тем, что она является художественным обобщенным изображением жизни. Ее воздействие сходно в известной мере с воздействием реальной действительности, но в то же время существенным образом отличается от нее.


Если у вас недавно закончилась практика написать отчет по ней вам могут помочь специалисты Work5.


В результате непосредственного взаимодействия с действительностью, затрагивающей мировоззрение человека, его потребности, личные установки и вкусы, формируется личность, ее собственный, выстраданный опыт. Непосредственно и реально взаимодействовать и изображением невозможно, читатель ничего не может в нем изменить, и изображенное писателем непосредственно не изменяет жизнь читателя. Поэтому непосредственное переживание читателем событий произведения относится им не к самому изображаемому, а к тому, что изображается, к изображенной действительности. Именно поэтому содержание произведения, вызванные им чувства, могут быть усвоены личностью читателя. Образы произведения не только отражают действительность, но и выражают обобщенный опыт писателя, его понимание жизни, ее эстетическую оценку. Из всего многообразия своего опыта писатель выражает то, что представляет общественный интерес, что может затрагивать других людей. Только при этом условии произведение будет читаться другими людьми. Заметим, что художественные образы воссоздаются читателем при чтении на основе собственного пережитого опыта. Если такого опыта у читателя нет, или его недостаточно, то именно благодаря воображению читатель получает первый опыт постижения действительности, быть может, пока не точный, но свой, первый и очень яркий. Поэтому художественное изображение затрагивает личность читателя, вызывает очень сильные чувства. Заметим, что чувства, возникающие у читателя в процессе чтения художественной литературы, носят обобщенный, теоретический характер и, оставаясь глубоко личными, они возвышаются до общечеловеческих. Вместе с тем переживаемые чувства читателем при чтении освобождены, очищены от всего мелкого, случайного, ситуационного, как это случается в реальной жизни, часто сопровождаются эмоциональным подъемом и просветленностью переживаний. Целью дипломной работы является разработка алгоритма автоматического формирования краткого пересказа электронных книг. В связи с поставленной целью, необходимо решить следующие задачи: 1. Проанализировать предметную область 2. Изучить методы реализации алгоритма 3. Реализовать алгоритм на языке программирования Объектом исследования данной работы является художественная литература. Предметом исследования – Алгоритм краткого пересказа книг. Дипломная работа состоит из введения, трех глав, заключения и списка литературы.

Читать дальше
В результате научно-исследовательской работы был проведен анализ: 1. сайтов, подходящих для парсинга произведений классической и мировой литературы; 2. возможных методов реализаций алгоритма; 3. решений, схожих с реализуемым. На основе результатов анализа сайтов были выбран сайт «Альдебаран» поскольку он удобен в пользовании, интуитивно понятен, бесплатен, со свободным доступом к литературе и обширным выбором произведений. Из результатов анализа возможных методов реализации алгоритма и сравнения аналогов можно сделать вывод, что для полноценного функционала нужно использовать этапы, модули и приложения компьютерной лингвистики, такие как графематический, морфологический, синтаксический, семантический и прагматический анализы, аннотирование, классификация, кластеризация, рубрицирование, реферирование, основанное на методах определения мало значимых предложений и частей текста для их последующего удаления.
Читать дальше
1. [Электронный ресурс]. URL: https://otherreferats.allbest.ru/pedagogics/00375037_0.html, Изучение классической литературы, (дата обращения - 20.12.2021) 2. [Электронный ресурс]. URL: https://pikabu.ru/story/5_legalnyikh_onlaynbibliotek_na_kotoryikh_mozhno_chitat_i_skachivat_knigi_besplatno_3898431, 5 легальных онлайн-библиотек, на которых можно читать и скачивать книги бесплатно, (дата обращения - 20.12.2021) 3. [Электронный ресурс]. URL: https://www.analyst.ru/index.php?lang=rus&dir=content/downloads/, Технологии обработки естественного языка, (дата обращения - 23.12.2021) 4. [Электронный ресурс]. URL: https://www.osp.ru/os/2017/02/13052221, Глубинное обучение для автоматической обработки текстов, (дата обращения - 23.12.2021) 5. Somers, H. Machine Translation: Latest Developments. In: The Oxford Handbook of Computational Linguistics. Mitkov R. (ed.). Oxford University Press, 2003, р. 512-528. 6. Маннинг К., Рагхаван П., Шютце Ч. Введение в информационный поиск – М.: Вильямс, 2011. 7. Васильев В. Г., Кривенко М. П. Методы автоматизированной обработки текстов. – М.: ИПИ РАН, 2008. 8. Барсегян А.А. и др. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP – 2-e изд. – СПб.: БХВ-Петербург, 2008. 9. Harabagiu, S., Moldovan D. Question Answering. In: The Oxford Handbook of Computational Linguistics. Mitkov R. (ed.). Oxford University Press, 2003, р. 560-582. 10. Grishman R., Information Extraction. In: The Handbook of Computational Linguistics and Natural Language Processing. A. Clark, C. Fox, and S. Lappin (Eds), WileyBlackwell, 2010, pp. 515-530. 11. Pang Bo, Lee L. Opinion Mining and Sentiment Analysis. In: Foundations and Trends Ⓡ in Information Retrieval. Now Publishers, 2008. 12. Большаков, И.А. КроссЛексика — большой электронный словарь сочетаний и смысловых связей русских слов. // Комп. лингвистика и интеллект. технологии: Труды межд. Конф. «Диалог 2009». Вып. 8 (15) М.: РГГУ, 2009, с. 45-50. 13. Bateman, J., Zock M. Natural Language Generation. In: The Oxford Handbook of Computational Linguistics. Mitkov R. (ed.). Oxford University Press, 2003, р.304. 14. Касевич В.Б. Элементы общей лингвистики. — М.: Наука, 1977. 15. Лингвистический энциклопедический словарь /Под ред. В. Н. Ярцевой, М.: Советская энциклопедия, 1990, 685 с. 16. Лукашевич Н.В. Тезаурусы в задачах информационного поиска. — М.: Изд-во Московского университета, 2011. 17. Hirst, G. Ontology and the Lexicon. In.: Handbook on Ontologies in Niformation Systems. Berlin, Springer, 2003. 18. Word Net: an Electronic Lexical Database. /Edit. by Christiane Fellbaum. Cambridge, MIT Press, 1998. 19. Biber, D., Conrad S., and Reppen D. Corpus Linguistics. Investigating Language Structure and Use. Cambridge University Press, Cambridge, 1998. 20. Национальный Корпус Русского Языка. http://ruscorpora.ru 21. Open Corpora: Открытый корпус. http://opencorpora.org 22. ГИКРЯ: генеральный интернет-корпус русского языка. http://www.webcorpora.ru/ 23. Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных // Компьютерная лингвистика: задачи, подходы, ресурсы. – 2017. – Pp. 8–30.
Читать дальше
Поможем с написанием такой-же работы от 500 р.
Лучшие эксперты сервиса ждут твоего задания

Похожие работы

курсовая работа
Злоупотребления при эмиссии ценных бумаг
Количество страниц:
25
Оригинальность:
71%
Год сдачи:
2022
Предмет:
Право
курсовая работа
Проблема межкультурных коммуникаций в СМИ
Количество страниц:
31
Оригинальность:
60%
Год сдачи:
2022
Предмет:
Журналистика
дипломная работа
"Радио России": история становления, редакционная политика, аудитория. (Имеется в виду радиостанция "Радио России")
Количество страниц:
70
Оригинальность:
61%
Год сдачи:
2015
Предмет:
История журналистики
курсовая работа
26. Центральное (всесоюзное) радиовещание: история создания и развития.
Количество страниц:
25
Оригинальность:
84%
Год сдачи:
2016
Предмет:
История журналистики

Поможем с работой
любого уровня сложности!

Это бесплатно и займет 1 минуту
image