Крупномасштабное машинное обучение вместе с Python
Здесь можно купить книгу "Крупномасштабное машинное обучение вместе с Python " в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.
Автор: Бастиан Шарден, Лука Массарон, Альберто Боскетти
Форматы: PDF
Издательство: ДМК Пресс
Год: 2018
Место издания: Москва
ISBN: 978-5-97060-506-6
Страниц: 358
Артикул: 95060
Возрастная маркировка: 16+
Краткая аннотация книги "Крупномасштабное машинное обучение вместе с Python"
Главная задача настоящей книги состоит в том, чтобы предоставить способы применения мощных методов машинного обучения с открытым исходным кодом в крупномасштабных проектах без привлечения дорогостоящих корпоративных решений или больших вычислительных кластеров. Описаны масштабируемое обучение в Scikit-learn, нейронные сети и глубокое обучение с использованием Theano, H2O и TensorFlow. Рассмотрены классификационные и регрессионные деревья, а также обучение без учителя. Охвачены эффективные методы машинного обучения в вычислительной среде MapReduce на платформах Hadoop и Spark на языке Python.
Содержание книги "Крупномасштабное машинное обучение вместе с Python "
Об авторах
О рецензентах
Предисловие
Глава 1. Первые шаги к масштабируемости
Подробное объяснение термина масштабируемости
Приведение крупномасштабных примеров
Введение в язык Python
Вертикальное масштабирование средствами Python
Горизонтальное масштабирование средствами Python
Python для крупномасштабного машинного обучения
Выбор между Python 2 и Python 3
Инсталляция среды Python
Пошаговая установка
Установка библиотек
Способы обновления библиотек
Научные дистрибутивы
Введение в Jupyter
Библиотеки Python
NumPy
SciPy
Pandas
Scikit-learn
Резюме
Глава 2. Масштабируемое обучение в Scikit-learn
Внеядерное обучение
Подвыборка как приемлемый вариант
Оптимизация по одному прецеденту за раз
Создание системы внеядерного обучения
Потоковая передача данных из источников
Наборы данных для реальных дел
Первый пример – потоковая передача набора данных Bike-sharing
Использование инструментов ввода-вывода библиотеки pandas
Работа с базами данных
Особое внимание упорядочению прецедентов
Стохастическое обучение
Пакетный градиентный спуск
Стохастический градиентный спуск
Реализация алгоритма SGD в библиотеке Scikit-learn
Определение параметров обучения алгоритма SGD
Управление признаками на потоках данных
Описание целевой переменной
Хэширование признаков
Другие элементарные преобразования
Тестирование и перекрестная проверка в потоке
Применение алгоритма SGD в деле
Резюме
Глава 3. Быстрообучающиеся реализации машин SVM
Наборы данных для самостоятельного экспериментирования
Набор данных Bike-sharing
Набор данных Covertype
Машины опорных векторов
Кусочно-линейная функция потерь и ее варианты
Объяснение реализации алгоритма SVM в Scikit-learn
Поиск нелинейных SVM с привлечением подвыборки
Реализация SVM в крупном масштабе на основе SGD
Отбор признаков посредством регуляризации
Добавление нелинейности в алгоритм SGD
Испытание явных высокоразмерных отображений
Доводка гиперпараметров
Другие альтернативы быстро обучающихся реализаций SVM
Резюме
Глава 4. Искусственные нейронные сети и глубокое обучение
Архитектура нейронной сети
Чему и как нейронные сети обучаются
Выбор правильной архитектуры
Нейронные сети в действии
Параллелизация для библиотеки sknn
Нейронные сети и регуляризация
Нейронные сети и гиперпараметрическая оптимизация
Нейронные сети и границы решения
Глубокое обучение в крупном масштабе с H2O
Крупномасштабное глубокое обучение с H2O
Сеточный поиск в H2O
Глубокое обучение и предтренировка без учителя
Глубокое обучение с theanets
Автокодировщики и обучение без учителя
Автокодировщик
Резюме
Глава 5. Глубокое обучение с библиотекой TensorFlow
Инсталляция TensorFlow
Операции TensorFlow
Машинное обучение в TensorFlow посредством SkFlow
Глубокое обучение с большими файлами – инкрементное обучение
Инсталляция библиотеки Keras и платформа TensorFlow
Сверточные нейронные сети в TensorFlow посредством Keras
Сверточный слой
Объединяющий слой
Полносвязный слой
CNN-сети с подходом на основе инкрементной тренировки
Вычисления на GPU
Резюме
Глава 6. Классификационные и регрессионные деревья в крупном масштабе
Агрегация бутстрапированных выборок
Случайный лес и экстремально рандомизированный лес
Быстрая параметрическая оптимизация посредством рандомизированного поиска
Экстремально рандомизированные деревья и большие наборы данных
Алгоритм CART и бустинг
Машины градиентного бустинга
Алгоритм XGBoost
Регрессия на основе XGBoost
Потоковая передача больших наборов данных посредством XGBoost
Персистентность модели XGBoost
Внеядерный алгоритм CART в среде H2O
Случайный лес и сеточный поиск в H2O
Стохастический градиентный бустинг и сеточный поиск в H2O
Резюме
Глава 7. Обучение без учителя в крупном масштабе
Методы машинного обучения без учителя
Разложение признаков – PCA
Алгоритм PCA в среде H2O
Кластеризация – алгоритм K-средних
Методы инициализации
Допущения алгоритма K-средних
Подбор оптимальной величины K
Масштабирование алгоритма K-средних – мини-пакет
Алгоритм K-средних в среде H2O
Алгоритм LDA
Масштабирование алгоритма LDA – оперативная память, CPU и машины
Резюме
Глава 8. Распределенные среды – Hadoop и Spark
От автономной машины к набору узлов
Зачем нужна распределенная платформа?
Настройка виртуальной машины
Виртуализатор VirtualBox
Конфигуратор Vagrant
Использование виртуальной машины
Экосистема Hadoop
Архитектура
Распределенная файловая система HDFS
Вычислительная парадигма MapReduce
Менеджер ресурсов YARN
Платформа Spark
Библиотека pySpark
Резюме
Глава 9. Практическое машинное обучение в среде Spark
Настройка виртуальной машины для данной главы
Распространение переменных по всем узлам кластера
Широковещательные переменные только для чтения
Аккумуляторные переменные только для записи
Широковещательные и аккумуляторные переменные – пример
Предобработка данных в среде Spark
Файлы JSON и объекты DataFrame платформы Spark
Работа с пропущенными данными
Группирование и создание таблиц в оперативной памяти
Запись предобработанного объекта DataFrame или RDD-набора на диск
Работа с объектами DataFrame
Машинное обучение с платформой Spark
Платформа Spark на наборе данных KDD99
Чтение набора данных
Конструирование признаков
Тренировка ученика
Оценка результативности ученика
Возможности конвейера машинного обучения
Ручная доводка
Перекрестная проверка
Заключительная очистка
Резюме
Приложение. Введение в графические процессоры и платформа Theano
Вычисления на GPU
Платформа Theano – параллельные вычисления на GPU
Установка платформы Theano
Предметный указатель
Все отзывы о книге Крупномасштабное машинное обучение вместе с Python
С книгой "Крупномасштабное машинное обучение вместе с Python" читают
Внимание!
При обнаружении неточностей или ошибок в описании книги "Крупномасштабное машинное обучение вместе с Python (автор Бастиан Шарден, Лука Массарон, Альберто Боскетти)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!
и мы свяжемся с вами в течение 15 минут
за оставленную заявку