ВВЕДЕНИЕ 3 1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 6 1.1 Анализ существующих решений 6 1.2 Классификация текста 13 1.3 Методы классификации 19 2 ПРЕДОБРАБОТКА И ВЕКТОРИЗАЦИЯ ТЕКСТА 23 2.1 Модель глубокого обучения для прогнозирования поведения пользователей при нажатии на рекламу 23 2.2 Автоматическое обучение взаимодействию функций с помощью самонастраиваемых нейронных сетей 30 2.3 Исследование алгоритмов рекламной системы путем анализа статистики действующих рекламных кампаний 32 3 ПРОЦЕСС РАЗРАБОТКИ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРЕДСКАЗАНИЯ КЛИКОВ НА РЕКЛАМНЫЕ ОБЪЯВЛЕНИЯ 43 3.1 Создание датасета 43 3.2 Предобработка текста 44 3.3 Векторизация текста 45 3.4 Классификация текста 49 ЗАКЛЮЧЕНИЕ 57 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58

Анализ и сравнение алгоритмов машинного обучения для предсказания кликов на рекламные объявления

дипломная работа
Информатика
60 страниц
99% уникальность
2023 год
5 просмотров
Алферова А.
Эксперт по предмету «Информатика»
Узнать стоимость консультации
Это бесплатно и займет 1 минуту
Оглавление
Введение
Заключение
Список литературы
ВВЕДЕНИЕ 3 1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 6 1.1 Анализ существующих решений 6 1.2 Классификация текста 13 1.3 Методы классификации 19 2 ПРЕДОБРАБОТКА И ВЕКТОРИЗАЦИЯ ТЕКСТА 23 2.1 Модель глубокого обучения для прогнозирования поведения пользователей при нажатии на рекламу 23 2.2 Автоматическое обучение взаимодействию функций с помощью самонастраиваемых нейронных сетей 30 2.3 Исследование алгоритмов рекламной системы путем анализа статистики действующих рекламных кампаний 32 3 ПРОЦЕСС РАЗРАБОТКИ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРЕДСКАЗАНИЯ КЛИКОВ НА РЕКЛАМНЫЕ ОБЪЯВЛЕНИЯ 43 3.1 Создание датасета 43 3.2 Предобработка текста 44 3.3 Векторизация текста 45 3.4 Классификация текста 49 ЗАКЛЮЧЕНИЕ 57 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
Читать дальше
Прогноз кликабельности (CTR), цель которого - предсказать вероятность того, что пользователь нажмет на объявление или товар, имеет решающее значение для многих онлайн-приложений, таких как онлайн-реклама и консультирующие (рекомендательные) системы. Эта проблема очень сложна, поскольку: 1) входные функции (например, идентификатор пользователя, возраст пользователя, идентификатор элемента, категория элемента) обычно разрежены; 2) эффективное предсказание опирается на комбинаторные функции высокого порядка (они же кросс-функции), которые очень трудоемки для ручной обработки экспертами предметной области и не перечислимы. Поэтому были предприняты усилия по поиску низкоразмерных представлений разреженных и высокоразмерных необработанных объектов и их значимых комбинаций. В этой работе предлагаем эффективный и действенный метод AutoInt для автоматического анализа взаимодействий объектов высокого порядка входных объектов. Предлагаемый алгоритм является очень общим и может быть применен как к числовым, так и к категориальным входным признакам. В частности, сопоставляем как числовые, так и категориальные признаки в одном и том же низкоразмерном пространстве. Затем предлагается многоцелевая самонастраиваемая нейронная сеть с остаточными связями для явного моделирования взаимодействий признаков в низкоразмерном пространстве. С помощью различных слоев многоцелевых самонапряженных нейронных сетей можно моделировать различные порядки комбинаций признаков входных признаков.


Чтобы заказать контрольную работу по физкультуре заполните форму заказа. Укажите все требования и мы приступим к выполнению вашей контрольной работы!


Вся модель может быть эффективно применена к крупномасштабным необработанным данным сквозным способом. Экспериментальные результаты на четырех реальных наборах данных показывают, что предложенный нами подход не только превосходит существующие современные подходы к прогнозированию, но и обеспечивает хорошую объясняющую способность сети. Проблемы развития машинного обучения представлены в трудах таких авторов как: Безкоровайный М.М., Давлеткиреева Л.З., Жиляев А.Н., Татузов А.Л. и др. При этом технологии в части функциональных возможностей, удобства использования и безопасности не стоят на месте и требуют дальнейшего научного изучения. Исследованиям по проблематике инноваций, в том числе для предсказания кликов, посвящены также работы таких авторов как П. Ф. Друкер, К. Дэвис, Э. М. Роджерс, Й. Шумпетер, И. Т. Балабанов, О. И. Лаврушин и др. Целью исследования является анализ и сравнение алгоритмов машинного обучения для предсказания кликов на рекламные объявления. Достижение этой цели предполагает решение комплекса следующих задач: – провести анализ существующих решений; – провести классификация текста; – изучить методы классификации; – разработать модель глубокого обучения для прогнозирования поведения пользователей при нажатии на рекламу; – провести автоматическое обучение взаимодействию функций с помощью самонастраиваемых нейронных сетей; – провести исследование алгоритмов рекламной системы путем анализа статистики действующих рекламных кампаний; – осуществить создание датасета; – осуществить предобработку текста; – осуществить векторизацию текста; – осуществить классификацию текста. Объект исследования – данные сайтов батутного центра Cosmica. Предметом исследования выступают клики на ссылки на сайте батутного центра Cosmica. Теоретическую основу исследования составили учебники, учебные пособия по банковскому делу, журнальные статьи, федеральное законодательство и нормативно-правовые акты Российской Федерации, материалы Банка России. Методологическая база исследования состоит из концепций и положений, содержащихся в трудах отечественных и зарубежных авторов по исследуемой проблеме, в публикациях специалистов, анализирующих предмет исследования на практике. В процессе исследования использовались различные приемы и методы: дедуктивный и индуктивный методы, синтез, индексный анализ, дедуктивные и индуктивный методы исследования и др. Работа состоит из введения, трех разделов, заключения и список использованной литературы.

Читать дальше
В данной работе были исследованы и применены на практике ряд методов по предобработке, векторизации и классификации текстовых документов. В ходе сравнения алгоритмов векторизации был выявлен один - TF-IDF, при котором достигались высокие результаты при любом из представленных методов классификации. Был найден самый оптимальный классификатор для задачи агрегации новостных статей - Bert_base. Однако классические методы машинного обучения также показали высокие результаты. Данное исследование имеет перспективы в дальнейшей работе. Существует множество методов машинного обучения, нейросетевых архитектур и векторизаторов, которые можно рассмотреть в данной задаче, а также каждый год появляются новые, более инновационные и прорывные решения.
Читать дальше
1. Братко, Иван Алгоритмы искусственного интеллекта на языке PROLOG / Иван Братко. - М.: Вильямс, 2022. - 640 c. 2. Булгаков, А. Г. Промышленные роботы. Кинематика, динамика, контроль и управление / А.Г. Булгаков. - М.: Солон-Пресс, 2022. - 800 c. 3. Вихнин, А. Г. Штурм четвертого мегапроекта. Кто будет новым Биллом Гейтсом? / А.Г. Вихнин, Н.З. Сакипов. - М.: Диалог-Мифи, 2020. - 288 c. 4. Громов, Г. Р. Национальные информационные ресурсы. Проблемы промышленной эксплуатации / Г.Р. Громов. - М.: Наука, 2021. - 240 c. 5. Гудвин, Г. Проектирование систем управления (+ CD-ROM) / Г. Гудвин. - М.: Бином. Лаборатория знаний, 2023. - 895 c. 6. Донцов, В.И. Виртуальные приборы в биологии и медицине / В.И. Донцов. - Москва: РГГУ, 2019. - 980 c. 7. Дрейфус, Х. Чего не могут вычислительные машины / Х. Дрейфус. - М.: Прогресс, 2019. - 336 c. 8. Евменов, В.П. Интеллектуальные системы управления: превосходство искусственного интеллекта над естественным интеллектом? / В.П. Евменов. - Москва: СИНТЕГ, 2019. - 745 c. 9. Здор, С.Е. Кодированная информация. От первых природных кодов до искусственного интеллекта / С.Е. Здор. - Москва: Машиностроение, 2020. - 605 c. 10. Зиновьев, Э. В. Конфликтные ситуации в информационных системах: моногр. / Э.В. Зиновьев, А.А. Стрекалев. - М.: Зинатне, 2022. - 168 c. 11. Иванов, А. И. Нейросетевые алгоритмы биометрической идентификации личности. Книга 15 / А.И. Иванов. - Москва: СИНТЕГ, 2020. - 144 c.
Читать дальше
Поможем с написанием такой-же работы от 500 р.
Лучшие эксперты сервиса ждут твоего задания

Похожие работы

курсовая работа
Самосознание личности и его функции
Количество страниц:
28
Оригинальность:
86%
Год сдачи:
2023
Предмет:
Психология
дипломная работа
Криптовалюта как объект гражданско-правового регулирования
Количество страниц:
60
Оригинальность:
64%
Год сдачи:
2023
Предмет:
Право
курсовая работа
Финансово-экономическое управление развитием региона
Количество страниц:
24
Оригинальность:
41%
Год сдачи:
2023
Предмет:
Микроэкономика
дипломная работа
"Радио России": история становления, редакционная политика, аудитория. (Имеется в виду радиостанция "Радио России")
Количество страниц:
70
Оригинальность:
61%
Год сдачи:
2015
Предмет:
История журналистики
курсовая работа
26. Центральное (всесоюзное) радиовещание: история создания и развития.
Количество страниц:
25
Оригинальность:
84%
Год сдачи:
2016
Предмет:
История журналистики

Поможем с работой
любого уровня сложности!

Это бесплатно и займет 1 минуту
image