ВВЕДЕНИЕ 3 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ КЛАССИФИКАЦИОННЫХ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ 10 1.1 Определение и постановка задачи классификации 10 1.2 Алгоритмы машинного обучения, используемые в решении задачи классификации 16 2 АНАЛИЗ ИСХОДНЫХ ДАННЫХ 21 2.1 Описание данных 21 2.2 Преобразование данных 21 2.3 Анализ данных 22 3 ПОСТРОЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ 43 3.1 Подбор и описание используемых моделей 43 3.2 Проведение эксперимента, реализация выбранных моделей классификации 47 3.3 Интерпретация результатов 55 ЗАКЛЮЧЕНИЕ 58 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 60

Применение методов машинного обучения

дипломная работа
Программирование
64 страниц
94% уникальность
2023 год
12 просмотров
Юрканова И.
Эксперт по предмету «Программирование»
Узнать стоимость консультации
Это бесплатно и займет 1 минуту
Оглавление
Введение
Заключение
Список литературы
ВВЕДЕНИЕ 3 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ КЛАССИФИКАЦИОННЫХ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ 10 1.1 Определение и постановка задачи классификации 10 1.2 Алгоритмы машинного обучения, используемые в решении задачи классификации 16 2 АНАЛИЗ ИСХОДНЫХ ДАННЫХ 21 2.1 Описание данных 21 2.2 Преобразование данных 21 2.3 Анализ данных 22 3 ПОСТРОЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ 43 3.1 Подбор и описание используемых моделей 43 3.2 Проведение эксперимента, реализация выбранных моделей классификации 47 3.3 Интерпретация результатов 55 ЗАКЛЮЧЕНИЕ 58 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 60
Читать дальше
Обоснование проблемы исследования. Увеличение стоимости отпускаемых по рецепту лекарств является важной проблемой для государственных и частных плательщиков во мире. В Америке продажи лекарств, отпускаемых по рецепту, в 2009 году составили 300 миллиардов долларов, что на 5% больше, чем в предыдущем году, а к 2022 году затраты составили 344 миллиарда американских долларов. Контроль фармацевтических затрат часто включает увеличение доли пациентов в расходах, например, за счет использования многоуровневого формуляра. Такие подходы эффективны для снижения затрат на лекарства для поставщиков медицинских услуг товаров, они также могут быть полезны для пациентов, поскольку они уменьшают использование ими основных лекарств, но это может иметь неблагоприятные последствия, которые могут увеличить, а не уменьшить общие расходы на здравоохранение. В других странах референтное ценообразование используется как инструмент сокращения расходов, который, как представляется, не оказывает нежелательного влияния на прибыль аптек.


На нашем сайте вы можете заказать курсовую работу по здравоохранению. Курсовая работа будет написана быстро и качественно. % оригинальности и квалификацию автора вы можете выбрать сами, для этого нужно заполнить форму заказа.


Эта политическая стратегия устанавливает стандартную цену или компенсацию уровня для группы терапевтически взаимозаменяемых препаратов, часто основанную на цене самого дешевого препарата. Производители остальных продуктов могут устанавливать цены выше или ниже этого уровня, тогда люди самостоятельно отвечают за расходы, превышающие базовую цену. В США такого рода политика называется «Максимально допустимая стоимость программы (MAC)». На обеспечение граждан США медикаментами из бюджета на здравоохранение выделено 10% средств из суммы в 2,5 триллиона долларов. Однако страховка доступна не каждому жителю США или не может покрыть все затраты. Лекарственные препараты, закупаемые в аптеках, не покрываются страховкой полностью. Вне зависимости от типа страхования большинство американцев на сегодняшний день помимо оплаты страхования вынуждены оплачивать все равно большую часть стоимости лечения и медикаментов за собственный счет. Медицинское страхование в США — договор со страховой организацией, по которому клиент ежемесячно выплачивает определенная сумма страховой компании, а она, в свою очередь, берет на себя часть медицинских расходов в случае болезни. Медицина в Соединенных Штатах действительно очень дорогостоящая, поэтому пренебрегать страховкой не стоит. Типы медицинской страховки: 1) Bronze: пациент платит 40%, страховая компания платит 60%. 2) Silver: пациент платит 30%, страховая компания платит 70%. 3) Gold: пациент платит 20%, страховая компания платит 80%. 4) Platinum: пациент платит 10%, страховая компания платит 90%. В каждой из категорий страховок есть возможность выбрать один из нескольких планов, которые различаются условиями покрытия. Наиболее часто встречающиеся страховые планы и их отличия: EPO – план, использование которого распространяется на погашение части затрат страховой компанией на медицинские услуги только в определенной сети медицинских учреждений (за исключением скорой помощи). HMO – план, согласно которому, клиент имеет возможность погашения страховых выплат в случае, если пациент обратится за медицинскими услугами к врачам, которые работают или оказывают услуги по контракту в определенной медицинской организации (исключая скорую помощь). POS – план покрывает и медицинские услуги внутри определенной сети, и за ее пределами, но в первом случае ваша часть оплаты услуг будет меньше, чем если вы обратитесь к специалистам из других учреждений. Также одним из условий данного плана является обязательное направление от семейного врача в случае, если вам необходимо обратиться к узкому специалисту. PPO – вы можете обращаться как к врачам внутри определенной сети, так и к специалистам из других клиник и диагностических центров, но в первом случае ваша часть оплаты будет меньше. В данном типе плана обязательное направление от семейного врача для посещения узких специалистов не предусмотрено. Как правило все виды страховок частично или полностью покрывают стоимость отпускаемых по рецепту лекарств. Однако покупка лекарств распространяется на определенных сетевых поставщиков, а также для получения компенсации необходимо предварительное разрешение и ограничения на объем покупки. Государственные виды страхования финансируются из налога с заработной платы и работодателя в размере 2,9% и взносами из выплат социального обеспечения. При этом корпорации оплачивают страховки своих сотрудников, но государство дает за это корпорациям налоговые субсидии. В настоящее время в Соединенных Штатах существует множество коммерческих страховых организаций, предлагающих различные пакеты страхования. Данные организации финансируются на 40% государством и, в зависимости от пакета, на 10–40% клиентом. Но не все пакеты предусматривают покрытие расходов на лекарства. Однако без страхования покрыть все расходы самостоятельно практически невозможно. Стоимость лекарственных препаратов в Соединенных Штатах гораздо выше, чем в Европейских странах (на 67% по сравнению с теми же препаратами в ЕС на 2016 год). Со временем в США цена на препарат продолжает расти в то время, как в странах ЕС – снижается. (+23% и –17% соответственно). Длительный срок патента на оригинальный препарат позволяет производителям долго держать их высокую стоимость. Срок патента впоследствии можно продлить при условии длительного периода регистрации и рассмотрения препарата или длительных клинических испытаниях, тогда срок патента может достигать 14,5 лет. Также патент можно продлить в результате преобразования или ребрендинга продукта, чем пользуются фармацевтические компании. Второй причиной высокой стоимости препаратов является успешное рекламирование, которое заставляет врачей и фармацевтов выписывать рецепты именно на дорогой препарат, не обращая внимания на стоимость лечения, а пациенты и плательщики должны это оплачивать, не имея возможности сделать выбор в пользу недорогого аналога. В Соединенных Штатах действует закон, распространяющийся на 26 штатов, в которых фармацевты обязаны получить согласие пациента на замену препарата из рецепта, в 30 штатах фармацевт может заменить рецептурное средство более дешевым аналогом с тем же действующим веществом. Однако тщательные рекламные кампании заставляют врачей и фармацевтов придерживаться популярных дорогих препаратов, что влияет на высокие затраты пациентов и страховых компаний. По причине введения соплатежей для пациентов, возникает проблема невозможности оплатить необходимые лекарства, что приводит к нарушениям приема лекарств, уменьшению дозировок и полному отказу от лечения, что ведет к еще большим затратам на здравоохранение. Актуальность темы. В течение последних 30 лет американское правительство стремится усовершенствовать систему здравоохранения в стране, проводит реформы и финансирует проекты по внедрению новых программ страхования граждан. Выделяемые государством колоссальные суммы на изменение политики и устройства системы здравоохранения не увеличивают контроль за ценами и издержками услуг и препаратов. В результате медицина и, в частности, аптеки почти полностью находятся в руках частных лиц, что приводит к очень высоким ценам на лекарства. Следовательно, пациенты, страховые организации и государство вынуждены тратить больше средств на лекарства. Актуальность данной работы заключается в том, что на данный момент проблема здравоохранения в США еще не решена. В данном исследовании будут рассмотрены факторы, влияющие на затраты американцев на лекарства. На основе имеющейся информации о покупателях рецептурных препаратов предполагается проанализировать их затраты с целью выявить группы людей, выплаты которых максимальны и выяснить причину больших затрат с целью поиска решения для дальнейших реформ здравоохранения. Обзор данных. Объектом исследования данной работы является группа жителей США, зафиксированных органами здравоохранения. О пациентах известен возраст, пол, количество детей в семье, индекс массы тела, регион проживания на территории Соединенных Штатов, привычка курения и сумма ежегодных расходов на лекарства, покрытая страховыми организациями. Согласно данным Бюджетного управления Конгресса, увеличение расходов на медицину связано с изменением в обслуживании благодаря технологическим инновациям. К другим факторам относятся: изменения страхового покрытия; высокий уровень дохода населения и рост цен. В данной работе исследуются факторы влияния на затраты жителей США помимо очевидных и не связанных с экономической и политической ситуацией, а с личной необходимостью к покупке лекарств. К таким факторам может относиться, например, ожирение или большое количество детей в семье или, наоборот, бездетные люди ведут более активный и рискованный образ жизни и нуждаются в постоянном обновлении аптечки и так далее. Содержание датасета: 1) возраст: возраст основного бенефициара; 2) пол: пол застрахованного гражданина – женщина / мужчина; 3) ИМТ: индекс массы тела, обеспечивающий представление о теле, вес, который относительно высок или низок по отношению к росту, объективный индекс массы тела (кг/м^2) с использованием соотношения роста к весу, в идеале от 18,5 до 24,9; 4) дети: количество детей, охваченных медицинским страхованием / количество иждивенцев; 5) курение: да / нет; 6) регион: район проживания в США, северо-восток, юго-восток, юго-запад, северо-запад; 7) расходы: индивидуальные медицинские расходы на лекарства, погашенные страховой организацией. Цели и задачи исследования. Согласно исследованиям РБК, стоимость лекарственных препаратов будет расти в США, соответственно, и затраты. Задачами в данной работе являются анализ и прогноз расходов американцев на медикаменты с целью определить портрет пациента и выявить иные факторы, влияющие на расходы жителей США на рецептурные препараты, помимо очевидных факторов, влияющих на рост затрат: увеличение стоимости медикаментов, сумма выделенных средств на здравоохранение, инфляция и внедрение новых программ финансирования здравоохранения США. Таким образом, предполагается найти новые данные для проектов, направленных на анализ системы здравоохранения в США, а именно на медикаментозные затраты. В данной работе будут рассмотрены затраты населения и поиск групп дорогостоящих пациентов. Объектом исследования является именно население и его мотивы приобретения препаратов, провести сравнительный анализ граждан различных групп и выявить взаимосвязь с количеством затрат на лекарства. В данном исследовании отмечены задачи: 1) поиск базы данных о гражданах США, приобретающих рецептурные препараты; 2) исследование вопроса системы здравоохранения в США; 3) изучение материалов для реализации технического раздела исследования; 4) выдвижение гипотез касательно факторов, влияющих на затраты, в данном датасете; 5) проверка гипотез и поиск зависимостей затрат от факторов; 6) формирование групп людей по разным признакам и сравнение результатов; 7) обозначение выводов по исследованию вопроса по выбранной теме; 8) прогнозирование затрат жителей США на лекарства на основе имеющихся данных; 9) визуализация результатов исследования. Работы состоит из введения, трех глав основной части, заключения и списка использованных источников.

Читать дальше
Анализируя данные моделей классификации, можно сделать следующие выводы:  В целом, все методы классификации показывают достаточно высокую точность (Accuracy) на уровне около 0,81-0,85.  При анализе показателей Precision и Recall можно отметить, что классификация с помощью метода опорных векторов и градиентного бустинга демонстрируют высокий уровень точности и полноты в предсказании положительного класса (1) со значениями Precision в районе 0,85 и Recall близким к 1.  Дерево решений и случайный лес также показывают неплохие результаты, но несколько ниже по сравнению с методами опорных векторов и градиентного бустинга.  В целом, метод опорных векторов и градиентный бустинг имеют более сбалансированные значения Precision и Recall для обоих классов.  F1-мера, которая является средним гармоническим значением Precision и Recall, также достаточно высока для всех методов классификации и составляет около 0,89-0,92. Таким образом, на основе представленных данных можно сделать вывод, что метод опорных векторов и градиентный бустинг показывают наилучшие результаты по сравнению с деревом решений и случайным лесом в данной задаче классификации. Исходя из того, что классификация 1 соответствует высоким расходам на здравоохранение, а классификация 0 - низким расходам, можно сделать следующие выводы: 1. Метод опорных векторов (SVM) является наилучшей моделью для классификации в данном случае. Он имеет высокую точность, полноту и F1-score для класса 1, что означает, что он хорошо идентифицирует высокие расходы на здравоохранение. 2. Другие модели, такие как Градиентный бустинг, Случайный лес и Дерево решений, также имеют высокую точность и полноту для класса 1, но их производительность несколько ниже по сравнению с SVM моделью. 3. Важно отметить, что все модели показывают низкую точность, полноту и F1-score для класса 0, что может указывать на то, что низкие расходы на здравоохранение не так легко классифицировать. 4. Однако SVM модель обеспечивает наилучшее сбалансированное сочетание Precision и Recall для обоих классов. Это означает, что она может быть полезна для идентификации и классификации как высоких, так и низких расходов на здравоохранение. Таким образом, на основе данных классификаций и связанных с ними расходов на здравоохранение, можно заключить, что SVM модель является наилучшей для определения высоких расходов на здравоохранение. Она может быть использована для принятия решений и планирования в области здравоохранения, основываясь на предсказаниях по классификации.
Читать дальше
1. Алпатов А. Н., Попов К. С., Чесалин А. Н. Анализ точности моделей машинного обучения с использованием методов векторизации для задач классификации разнородных текстовых данных //International Journal of Open Information Technologies. – 2022. – Т. 10. – №. 7. – С. 47-53. 2. Баданина Н. Д., Судаков В. А. Модели машинного обучения для классификации отзывов о банках //Препринты Института прикладной математики им. МВ Келдыша РАН. – 2021. – №. 0. – С. 50-14. 3. Бекбаева А. М. и др. Классификация содержания фосфора методами машинного обучения по данным дистанционного зондирования Земли //The Scientific Heritage. – 2020. – №. 56-3. – С. 29-36. 4. Бородин В. А., Проталинский О. М., Шуршев В. Ф. Использование методов машинного обучения при составлении программ ремонта энергетического оборудования //Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. – 2019. – №. 3. – С. 25-33. 5. Гетьман А. И., Иконникова М. К. Обзор методов классификации сетевого трафика с использованием машинного обучения //Труды Института системного программирования РАН. – 2020. – Т. 32. – №. 6. – С. 137-154. 6. Гусев П. Ю. Обработка текстов и подготовка моделей векторизации для программного комплекса классификации научных текстов //Моделирование, оптимизация и информационные технологии. – 2021. – Т. 9. – №. 1. – С. 6-7. 7. Гусев П. Ю. Разработка системы классификации текстов по научным специальностям с применением методов машинного обучения //Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2021. – Т. 19. – №. 1. – С. 39-47. 8. Дементий Ю. А. Активное обучение интеллектуальной релейной защиты. Противостоящие режимы //Электрические станции. – 2021. – №. 9. – С. 45-53. 9. Дементий Ю. А. Активное обучение классификатора режимов работы объекта с использованием имитационной модели //Современные тенденции развития цифровых систем релейной защиты и автоматики. – 2021. – С. 157-162. 10. Демидова Л. А., Филатов А. В. Разработка модели классификации состояния жёстких дисков на основе LSTM-нейронных сетей //Высокопроизводительные вычислительные системы и технологии. – 2021. – Т. 5. – №. 1. – С. 37-42. 11. Долгачев Р. Ф. Анализ процесса классификации изображения с помощью машинного обучения //Альманах научных работ молодых ученых университета ИТМО. – 2019. – С. 72-74. 12. Желябин Д. В. Применение методов машинного обучения для решения задачи NLP классификации текста на основе анализа семантики естественного языка //Вестник Алтайской академии экономики и права. – 2020. – №. 6-2. – С. 229-235. 13. Кадиев Ш. К. и др. Обзор исследований в области классификации для машинного обучения при разработке интеллектуальных систем поддержки принятия управленческих решений //Технологии техносферной безопасности. – 2020. – №. 3. – С. 20-29. 14. Клячкин В. Н., Кувайскова Ю. Е., Ломовцева Н. А. ДИАГНОСТИКА СОСТОЯНИЯ ТЕХНИЧЕСКОГО ОБЪЕКТА С ПОМОЩЬЮ КЛАССИФИКАЦИИ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ //Программные продукты и системы. – 2021. – Т. 34. – №. 4. – С. 572-578. 15. КРИЧЕВСКИЙ М. Л., МАРТЫНОВА Ю. А. Выбор варианта развития предприятия методами машинного обучения //ВОПРОСЫ ИННОВАЦИОННОЙ ЭКОНОМИКИ Учредители: ООО» Триумф-Регион». – 2022. – Т. 12. – №. 2. – С. 1099-1110. 16. Кузин Д. А. и др. Применение методов машинного обучения для классификации акустических сигналов по спектральным характеристикам //Известия СПбГЭТУ ЛЭТИ. – 2021. – №. 3. – С. 48. 17. Кузин Д. А., Стаценко Л. Г. Сравнительный анализ моделей машинного обучения при решении задачи классификации гидроакустических шумов морских судов //Вестник Инженерной школы Дальневосточного федерального университета. – 2022. – №. 2 (51). – С. 62-68. 18. Лебедев И. С. Адаптивное применение моделей машинного обучения на отдельных сегментах выборки в задачах регрессии и классификации //Информационно-управляющие системы. – 2022. – №. 3 (118). – С. 20-30. 19. Лошманов В. И., Кравец А. Г. Разработка и валидация метода классификации офтальмологической патологии с применением глубокого машинного обучения //Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. – 2021. – №. 2. – С. 57-65. 20. Мальчиц В. С. Применение методов машинного обучения для классификации новостей //Молодежь ХХI ВЕКА: шаг в будущее. – 2019. – С. 208-209. 21. Минаев В. А., Реброва А. Д., Симонов А. В. Выявление деструктивного контента в социальных медиа на основе моделей машинного обучения //Информация и безопасность. – 2021. – Т. 24. – №. 1. – С. 7. 22. Митяков С. Н., Митяков Е. С. Машинное обучение в задачах исследования инновационных процессов //Журнал прикладных исследований. – 2020. – Т. 1. – №. 4. – С. 6-13. 23. Нгуен М. Т. Тестирование методов машинного обучения в задаче классификации HTTP запросов с применением технологии TF-IDF //Вестник ВГУ. Серия: Системный анализ и информационные технологии. – 2019. – №. 4. – С. 119-131. 24. Никаноров М. С. Классификация сельскохозяйственной техники на основе алгоритмов машинного обучения //Национальная научно-практическая конференция, посвященная 85-летию со дня рождения АМ Гатаулина. – 2021. – С. 145-155. 25. Охлупина О. В., Прокопенко А. А., Згонникова А. О. О ёмкости модели классификации //Ученые записки Брянского государственного университета. – 2021. – №. 4 (24). – С. 22-26. 26. ПАВЛИЧЕВА Е. Н. и др. Комбинационная модель машинного обучения для анализа сетевого трафика в интересах защиты информации //Информационные системы и технологии. – 2021. – №. 1. – С. 109-118. 27. Петрин Д. А., Белов Ю. С. Улучшение качества моделей машинного обучения в задачах классификации изображений на основе подходов извлечения признаков и точной настройки модели //Электронный журнал: наука, техника и образование. – 2020. – №. 1. – С. 104-111.
Читать дальше
Поможем с написанием такой-же работы от 500 р.
Лучшие эксперты сервиса ждут твоего задания

Похожие работы

дипломная работа
Совершенствование маркетинговых технологий продвижения продукции в Интернет- среде
Количество страниц:
61
Оригинальность:
97%
Год сдачи:
2023
Предмет:
Маркетинг
курсовая работа
Виды правонарушений
Количество страниц:
30
Оригинальность:
51%
Год сдачи:
2023
Предмет:
Теория государства и права
курсовая работа
Уголовная ответственность за доведение до самоубийства
Количество страниц:
25
Оригинальность:
51%
Год сдачи:
2023
Предмет:
Право
дипломная работа
"Радио России": история становления, редакционная политика, аудитория. (Имеется в виду радиостанция "Радио России")
Количество страниц:
70
Оригинальность:
61%
Год сдачи:
2015
Предмет:
История журналистики
курсовая работа
26. Центральное (всесоюзное) радиовещание: история создания и развития.
Количество страниц:
25
Оригинальность:
84%
Год сдачи:
2016
Предмет:
История журналистики

Поможем с работой
любого уровня сложности!

Это бесплатно и займет 1 минуту
image