Анализ больших наборов данных
книга

Анализ больших наборов данных

Здесь можно купить книгу "Анализ больших наборов данных " в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Юре Лесковец, Ананд Раджараман, Джеффри Ульман

Форматы: PDF

Издательство: ДМК Пресс

Год: 2023

Место издания: Москва

ISBN: 978-5-89818-304-2

Страниц: 499

Артикул: 103273

Возрастная маркировка: 16+

Электронная книга
799

Краткая аннотация книги "Анализ больших наборов данных"

Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining). В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Издание будет в равной мере полезна студентам и программистам-практикам.

Содержание книги "Анализ больших наборов данных "


Предисловие
О чем эта книга
Требования к читателю
Упражнения
Поддержка в вебе
Автоматизированные домашние задания
Благодарности
ГЛАВА 1. Добыча данных
1.1. Что такое добыча данных?
1.2. Статистические пределы добычи данных
1.3. Кое-какие полезные сведения
1.4. План книги
1.5. Резюме
1.6. Список литературы
ГЛАВА 2. MapReduce и новый программный стек
2.1. Распределенные файловые системы
2.2. MapReduce
2.3. Алгоритмы, в которых используется MapReduce
2.4. Обобщения MapReduce
2.5. Модель коммуникационной стоимости
2.6. Теория сложности MapReduce
2.7. Резюме
2.8. Список литературы
ГЛАВА 3. Поиск похожих объектов
3.1. Приложения поиска близкого соседям
3.2. Разбиение документов на шинглы
3.3. Сигнатуры множеств с сохранением сходства
3.4. Хэширование документов с учетом близости
3.5. Метрики
3.6. Теория функций, учитывающих близость
3.7. LSH-семейства для других метрик
3.8. Применения хэширования с учетом близости
3.9. Методы для высокой степени сходства
3.10. Резюме
3.11. Список литературы
ГЛАВА 4. Анализ потоков данных
4.1. Потоковая модель данных
4.2. Выборка данных из потока
4.3. Фильтрация потоков
4.4. Подсчет различных элементов в потоке
4.5. Оценивание моментов
4.6. Подсчет единиц в окне
4.7. Затухающие окна
4.8. Резюме
4.9. Список литературы
ГЛАВА 5. Анализ ссылок
5.1. PageRank
5.2. Эффективное вычисление PageRank
5.3. Тематический PageRank
5.4. Ссылочный спам
5.5. Хабы и авторитетные страницы
5.6. Резюме
5.7. Список литературы
ГЛАВА 6. Частые предметные наборы
6.1. Модель корзины покупок
6.2. Корзины покупок и алгоритм Apriori
6.3. Обработка больших наборов данных в оперативной памяти
6.4. Алгоритм с ограниченным числом проходов
6.5. Подсчет частых предметных наборов в потоке
6.6. Резюме
6.7. Список литературы
ГЛАВА 7. Кластеризация
7.1. Введение в методы кластеризации
7.2. Иерархическая кластеризация
7.3. Алгоритм k средних
7.4. Алгоритм CURE
7.5. Кластеризация в неевклидовых пространствах
7.6. Кластеризация для потоков и параллелизм
7.7. Резюме
7.8. Список литературы
ГЛАВА 8. Реклама в Интернете
8.1. Проблемы онлайновой рекламы
8.2. Онлайновые алгоритмы
8.3. Задача о паросочетании
8.4. Задача о ключевых словах
8.5. Реализация алгоритма Adwords
8.6. Резюме
8.7. Список литературы
ГЛАВА 9. Рекомендательные системы
9.1. Модель рекомендательной системы
9.2. Рекомендации на основе фильтрации содержимого
9.3. Коллаборативная фильтрация
9.4. Понижение размерности
9.5. Задача NetFlix
9.6. Резюме
9.7. Список литературы
ГЛАВА 10. Анализ графов социальных сетей
10.1. Социальные сети как графы
10.2. Кластеризация графа социальной сети
10.3. Прямое нахождение сообществ
10.4. Разрезание графов
10.5. Нахождение пересекающихся сообществ
10.6. Simrank
10.7. Подсчет треугольников
10.8. Окрестности в графах
10.9. Резюме
10.10. Список литературы
ГЛАВА 11. Понижение размерности
11.1. Собственные значения и собственные векторы
11.2. Метод главных компонент
11.3. Сингулярное разложение
11.4. CUR-декомпозиция
11.5. Резюме
11.6. Список литературы
ГЛАВА 12. Машинное обучение на больших данных
12.1. Модель машинного обучения
12.2. Перцептроны
12.3. Метод опорных векторов
12.4. Обучение по ближайшим соседям
12.5. Сравнение методов обучения
12.6. Резюме
12.7. Список литературы
Предметный указатель

Все отзывы о книге Анализ больших наборов данных

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Внимание!
При обнаружении неточностей или ошибок в описании книги "Анализ больших наборов данных (автор Юре Лесковец, Ананд Раджараман, Джеффри Ульман)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!