Введение 3
Глава 1. Data Mining и его методы 4
1.1. Факторный анализ 4
1.2. Кластеризация К-средними 6
1.3. Линейная регрессия 7
1.4. Выводы 8
Глава 2. Расчёт показателей учебных заведений методами DataMining 9
2.1. Применение факторного анализа для оценки показателей учебных заведений 9
2.2. Использование статистических методов для кластерного анализа 10
2.3. Применение регрессионного анализа 15
2.4. Выводы 18
Заключение 19
Список литературы 20
Приложение A - Исходные показатели 22
Приложение B – Состояние учреждений 23
Читать дальше
В рамках данной курсовой работы мы проанализировали собранные Министерством образования и науки Российской Федерации данные об эффективности деятельности высших учебных заведений регионов, выделенные на основании соответствующей методики анализа эффективности деятельности высших учебных заведений Российской Федерации.
В рамках проведенного исследования был проведен факторный анализ всех переменных, выявлены укрупненные группы, которые состоят из различных более мелких факторов. Привели их в единую концепцию, определили значимость каждой группы на результативную переменную.
Так же был проведен кластерный анализ, который выявил пять кластеров. Каждый кластер построен на укрупненных факторах влияния и содержит в себе от одного до 70 образовательных учреждений. Проведен анализ каждого кластера, выявлены их наиболее характерные признаки, описаны каждый из них.
В свою очередь множественный регрессионный анализ проиллюстрировал тесную связь между пятью показателями, которая можем быть распространена на всю генеральную совокупность. Все пять показателей оценки относятся к общим сторонам оценки ВУЗа и не учитывают отраслевую специфику учреждений, что может искусственно влиять на низкие показатели эффективности того или иного образовательного учреждения
Таким образом, проведенная работа дает основание утверждать, что факторный, кластерный и регрессионные анализы могут быть применимы для глубоких исследований информации в неструктурированных массивах данных, тем не менее без понимания отраслевой специфики изучаемых явлений не всегда может существовать возможность их однозначной интерпретации.
Читать дальше
1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP -СПб.: Изд. БХВ-Петербург, 2008. -384 с.
2. Глобализация, рост и бедность. Построение всеобщей мировой экономики; Весь Мир - М., 2016. - 206 c.
3. Дюк В.А., Самойленко А.П. Data Mining: учебный курс. -- СПб.: Питер, 2001 – 367 c.
4. Журавлёв Ю.И., Рязанов В.В., Сенько О.В. РАСПОЗНАВАНИЕ. Математические методы. Программная система. Практические применения. — М.: Изд. «Фазис», 2006. — 176 с.
5. Захаров С. И., Холмская А. Г. Повышение эффективности обработки сигналов вибрации и шума при испытаниях механизмов // Вестник машиностроения : журнал. — М.: Машиностроение, 2001. — № 10. — С. 31—32.
6. Зиновьев А. Ю. Визуализация многомерных данных. — Красноярск: Изд. Красноярского государственного технического университета, 2000. — 180 с
7. Кулаичев, А.П. Методы и средства комплексного статистического анализа данных: Учебное пособие / А.П. Кулаичев. - М.: Инфра-М, 2016. - 347 c.
8. Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям. Учебное пособие. -2-е изд., испр. -СПб.: Питер, 2013. -704 с.
9. Радченко С. Г. Устойчивые методы оценивания статистических моделей. — К.: ПП «Санспарель», 2005. — 504 с.
10. Степанов Р. Г. Технология Data Mining: Интеллектуальный Анализ Данных. - Казанский Государственный Университетим. В.И.Ульянова-Ленина, 2008.
11. Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа = Methoden der Korrelation - und Regressiolynsanalyse. — М.: Финансы и статистика, 1981. — 302 с.
12. Чубукова И. А. Data Mining: учебное пособие. -М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. -382 с.
13. Энциклопедия статистических терминов. В 8 т. Т. 2. Инструментальные методы статистики /Федеральная служба государственной статистики. -М., 2013. URL: http://www.gks.ru/free_doc/new_site/rosstat/stbook11/tom2.pdf
14. Viktor Mayer-Schonberger and Kenneth Cukier Big Data: Revolution That Will Transform How We Live, Work, and Think; Mariner Books, Houghton Mifflin, An Eamon Dolan Book - М., 2014. - 272 c.
15. Mining of Massive Datasets Stanford University. //The Stanford InfoLab. URL: http://i.stanford.edu/~ullman/mmds/book.pdf
Читать дальше