ВВЕДЕНИЕ 3 ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 5 1.1. Обзор алгоритмов построения дерева решений 5 1.2. Анализ моделей шума и способов обработки зашумленных данных 9 1.3.Метод ID3(C4.5) 11 1.4.Метод UD3 16 ГЛАВА 2. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА 24 2.1.Средства разработки 24 2.2.Структурная схема программы 29 2.3.Описание пользовательского интерфейса 31 2.4.Форма хранения данных 39 ГЛАВА 3. КОМПЛЕКСНАЯ ОТЛАДКА СИСТЕМЫ 40 3.1.Пример работы программы 40 3.2.Проведение экспериментов и сравнительная оценка полученных результатов 43 3.3.Результаты тестирования 48 ЗАКЛЮЧЕНИЕ 52 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 55

Разработка и программная реализация системы обобщения информации на основе методов решающих деревьев

дипломная работа
0 страниц
100% уникальность
2011 год
63 просмотров
Вергун М.
Эксперт по предмету «Программирование»
Узнать стоимость консультации
Это бесплатно и займет 1 минуту
Оглавление
Введение
Заключение
Список литературы
ВВЕДЕНИЕ 3 ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ 5 1.1. Обзор алгоритмов построения дерева решений 5 1.2. Анализ моделей шума и способов обработки зашумленных данных 9 1.3.Метод ID3(C4.5) 11 1.4.Метод UD3 16 ГЛАВА 2. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА 24 2.1.Средства разработки 24 2.2.Структурная схема программы 29 2.3.Описание пользовательского интерфейса 31 2.4.Форма хранения данных 39 ГЛАВА 3. КОМПЛЕКСНАЯ ОТЛАДКА СИСТЕМЫ 40 3.1.Пример работы программы 40 3.2.Проведение экспериментов и сравнительная оценка полученных результатов 43 3.3.Результаты тестирования 48 ЗАКЛЮЧЕНИЕ 52 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 55
Читать дальше
В условиях современности всё возрастающие объемы данных с трудом поддаются анализу и обобщению, при этом в базах данных могут быть скрытые закономерности, не видимые невооруженным глазом, но при этом весьма полезные для различных экспертов и менеджеров, принимающих решения. Анализ такого рода информации экспертом будет весьма сложной задачей, однако эти закономерности можно извлечь с помощью компьютерных систем, способных быстро обрабатывать большое количество данных, извлекать знания из них, и представлять новые знания в удобной для восприятия человеком форме. Одной из задач искусственного интеллекта является построение обобщенных моделей данных или извлечений знаний с использованием больших массивов экспериментальных данных, содержащих информацию об исследуемых процессах и явлениях. Интеллектуальные системы, решающие эти задачи, находят практическое применение во множестве областей – медицина и здравоохранение (установление диагноза, выписка лекарств), менеджмент, бизнес, маркетинг (вопрос о выдаче кредитов, инвестировании, исследование рынка, подбор товаров покупателю по характеристикам). Очевидно, вся информация, охватывающая такие явления, и имеющаяся в распоряжении исследователей, обычно не является полной и точной. Это может быть вызвано некорректным измерением входного параметра, неверным или слишком субъективным описанием значения параметра экспертом, использованием испорченных измерительных приборов, потерей данных при хранении и пересылке информации. Поэтому задачей данной работы будет моделирование систем машинного обучения при наличии шума в массивах данных, описывающих реальные предметные области и использующиеся на практике (медицина, бизнес и т.


Если зачет проходит онлайн решить задачу вам помогут в Work5.


. п.) и изучение работы алгоритмов индуктивного формирования понятия на данных, подверженных влиянию шума и сравнение «вреда» различных видов шума в массивах данных. Таким образом, актуальность данной работы видится в детальной проработке и программной реализации системы обобщения информации на основе методов решающих деревьев с учетом наличия шума в данных. Целью данного дипломного проекта является разработка и программная реализация системы обобщения информации на основе методов решающих деревьев. Задачами дипломного проекта, в соответствии с целью, являются: • анализ предметной области, определение имеющихся проблем в работе, нахождение путей их решения; • изучение методик решений и комплексов средств решения задачи; • определение требований, предъявляемых к проектируемой программной системе; • моделирование алгоритмов одних из самых лучших алгоритмов индуктивного формирования понятий, а именно: ID3 и UD3, а также различного вида шума в массивах данных; • изучение работы алгоритмов индуктивного формирования понятия на данных, подверженных влиянию шума и сравнение «вреда» различных видов шума в массивах данных. • проектирование и внедрение программной системы.

Читать дальше
В данной работе была рассмотрена проблема построения обобщенных понятий в базах данных, которые содержат «шум». Многие алгоритмы построения продукционных правил являются очень чувствительными к некорректным данным в базах, а именно в реальных базах данных «идеальные» данные являются большой редкостью по причинам ошибок во входных данных. В работе было проведено изучение алгоритмов ID3(C4.5) и UD3 построения обобщенных понятий по обучающим выборкам на основе получения конъюнкций условий. Алгоритм UD3 был выбран исходя из того, что он наиболее приспособлен к обработке баз данных, содержащих «зашумленные данные». Программная реализация алгоритма была осуществлена в среде Borland Delphi 7. Была смоделирована работа алгоритма в режимах «обучения» и «классификации». По результатам тестирования программы, выяснилось, что алгоритм, на основе которого разработана программа, подходит для построения обобщенных понятий по обучающим выборкам. В результате проведенного тестирования выяснилось, что алгоритм UD3 в отличие от алгоритма ID3(C4.5), лучше справляется с задачей обработки зашумленных баз данных, что и являлось основной задачей данной работы.
Читать дальше
1. Бериша А.М., Вагин В.Н., Куликов А.В., Фомина М.В. Методы обнаружения знаний в «зашумленных» базах данных // Известия РАН. Теория и системы управления. 2005, № 6. стр.143–158.Вагин В.Н. Дедукция и обобщение в системах принятия решений. – М.: Наука, 1988. 2. Бериша А.М., Вагин В.Н., Куликов А.В., Фомина М.В. Методы обнаружения знаний в «зашумленных» базах данных // Известия РАН. Теория и системы управления. – 2005. – №6. – С.143–158.Бонгард М.М. Проблема узнавания. – М:. Наука, 1967. 3. Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомин М.В. Достоверный и правдоподобный вывод в интеллектуальных системах. М.: ФизМатЛит. 2008. 4. Quinlan J.R. Induction on Decision Trees. Machine Learning. 1986. 5. Peter Clark, Tim Niblett, Induction in Noisy Domains. 1994. 6. Quinlan J.R. Improved Use of Continuous Attributes in C 4.5//Journal of Artifical Intelligence Reseach, Vol. 4, 1996, 77-90 7. J. Bazan, A Comparison of Dynamic and Non-dynamic Rough Set Methods for Extracting Laws from Decision Tables//Rough Sets in Knowledge Discovery 1.: Methodology and Application/ Ed. by L.Polkowski, A.Skowron. Heidelberg: Phisica-Verlag, 1998, 321-365. 8. H. S. Nguyen, S. H. Nguyen. Discretization Methods in Data Mining// Rough Sets in Knowledge Discovery 1: Methodology and Application/ Ed. by L.Polkowski, A.Skowron. Heidelberg: Phisica-Verlag, 1998, 451-482. 9. V.N. Vagin, A.V. Kulikov , M.V. Fomina. The Development of the Generalization Algorithm Based on the Rough Set Theory./ Intern. Journal "Information Theories & Applications", Vol.13, Nu. 3, 2006, 255-262. 10. Kulikov A., Fomina M. The Development of Concept Generalization Algorithm Using Rough Set Approach / Knowledge-Based Software Engineering: Proceedings of the Sixth Joint Conference on Knowledge-Based Software Engineering (JCKBSE 2004) // V.Stefanuk and K. Kajiri (eds). – IOS Press, 2004. – P.261–268. 11. V. Mookerjee, M. Mannino, R. Gilson, Improving the Performance Stability of Inductive Expert Systems under Input Noise.// Information Systems Research. 1995, Vol.6, Nu.4, 328-356. 12. Merz C.J., Murphy P.M. UCI Repository of Machine Learning Datasets. – Information and Computer Science University of California, Irvine, CA, 1998. http://www.ics.uci.edu/~mlearn/MLRepository.html
Читать дальше
Поможем с написанием такой-же работы от 500 р.
Лучшие эксперты сервиса ждут твоего задания

Похожие работы

дипломная работа
"Радио России": история становления, редакционная политика, аудитория. (Имеется в виду радиостанция "Радио России")
Количество страниц:
70
Оригинальность:
61%
Год сдачи:
2015
Предмет:
История журналистики
курсовая работа
26. Центральное (всесоюзное) радиовещание: история создания и развития.
Количество страниц:
25
Оригинальность:
84%
Год сдачи:
2016
Предмет:
История журналистики
практическое задание
Анализ журнала "Индекс. Досье на цензуру"
Количество страниц:
4
Оригинальность:
75%
Год сдачи:
2013
Предмет:
История журналистики
реферат
причины последствия политической борьбы по вопросам построения социализма в ссср в 20-30 годы 20века
Количество страниц:
10
Оригинальность:
100%
Год сдачи:
2010
Предмет:
История Отечества
реферат
международные монополии и их роль на мировом рынке
Количество страниц:
15
Оригинальность:
100%
Год сдачи:
2010
Предмет:
Мировая экономика

Поможем с работой
любого уровня сложности!

Это бесплатно и займет 1 минуту
image