книга

Предварительная подготовка данных в Python

Здесь можно купить книгу "Предварительная подготовка данных в Python " в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Том 1. Инструменты и валидация

Автор: Артём Груздев

Форматы: PDF

Издательство: ДМК Пресс

Год: 2023

Место издания: Москва

ISBN: 978-5-93700-156-6

Страниц: 817

Артикул: 108052

Возрастная маркировка: 16+

Электронная книга

2399 ₽

Купить и скачать

Читать фрагмент

Аннотация

Краткая аннотация книги "Предварительная подготовка данных в Python"

В двухтомнике представлены материалы по применению классических методов машинного обучения в различных промышленных задачах. Первый том посвящен инструментам Python – основным библиотекам, классам и функциям, необходимым для предварительной подготовки данных, построения моделей машинного обучения, выполнения различных стратегий валидации. В конце первого тома разбираются задачи с собеседований по SQL, Python, математической статистике и теории вероятностей. Издание рассчитано на специалистов по анализу данных, а также может быть полезно широкому кругу специалистов, интересующихся машинным обучением.

Содержание

Содержание книги "Предварительная подготовка данных в Python "

Введение
ЧАСТЬ 1. НЕМНОГО МАТЕМАТИКИ
1.1. Функция
1.2. Производная
1.3. Дифференцирование сложных функций
1.4. Частная производная
1.5. Градиент
1.6. Функция потерь и градиентный спуск
Часть 2. Инструменты
1. Введение
1.1. Структуры данных
1.2. Функция
1.3. Полезные встроенные функции
1.4. Класс
1.5. Знакомство с Anaconda
2. IPython и Jupyter Notebook
3. NumPy
3.1. Создание массивов NumPy
3.2. Обращение к элементам массива
3.3. Получение краткой информации о массиве
3.4. Изменение формы массива
3.5. Конкатенация массивов
3.6. Функции математических операций, знакомство с правилами транслирования
3.7. Обработка пропусков
3.8. Функция np.linspace()
3.9. Функция np.logspace()
3.10. Функция np.digitize()
3.11. Функция np.searchsorted()
3.12. Функция np.bincount()
3.13. Функция np.apply_along_axis()
3.14. Функция np.insert()
3.15. Функция np.repeat()
3.16. Функция np.unique()
3.17. Функция np.take_along_axis()
3.18. Функция np.array_split()
4. Библиотеки Numba, datatable, bottleneck для ускорения вычислений
4.1. Numba
4.2. Datatable
4.3. Bottleneck
5. SciPy
6. pandas
6.1. Почему pandas?
6.2. Библиотека pandas построена на NumPy
6.3. pandas работает с табличными данными
6.4. Объекты DataFrame и Series
6.5. Задачи, выполняемые pandas
6.6. Кратко о типах данных
6.7. Представление пропусков
6.8. Какую версию pandas использовать?
6.9. Подробно знакомимся с типами данных
6.10. Чтение данных
6.11. Получение общей информации о датафрейме
6.12. Изменение настроек вывода с помощью функции get_options()
6.13. Знакомство с индексаторами [], loc и iloc
6.14. Фильтрация данных
6.15. Агрегирование данных
6.16. Анализ частот с помощью таблиц сопряженности
7. scikit-learn
7.1. Основы работы с классами, строящими модели предварительной подготовки данных и модели машинного обучения
7.2. Строим свой первый конвейер моделей
7.3. Разбираемся с дилеммой смещения–дисперсии и знакомимся с бутстрепом
7.4. Обработка пропусков с помощью классов MissingIndicator и SimpleImputer
7.5. Выполнение дамми-кодирования с помощью класса OneHotEncoder и функции get_dummies(), знакомство с разреженными матрицами
7.6. Автоматическое построение конвейеров моделей с помощью класса Pipeline
7.7. Знакомство с классом ColumnTransformer
7.8. Класс FeatureUnion
7.9. Выполнение перекрестной проверки с помощью функции cross_val_score(), получение прогнозов перекрестной проверки с помощью функции cross_val_predict(), сохранение моделей перекрестной проверки с помощью функции cross_validate()
7.10. Виды перекрестной проверки для данных формата «один объект – одно наблюдение» (отсутствует ось времени)
7.11. Виды перекрестной проверки для данных формата «один объект – несколько наблюдений» и стратифицированных данных (отсутствует ось времени)
7.12. Обычный и случайный поиск наилучших гиперпараметров по сетке с помощью классов GridSearchCV и RandomizedSearchCV
7.13. Вложенная перекрестная проверка
7.14. Классы PowerTransformer, KBinsDiscretizer и FunctionTransformer
7.15. Написание собственных классов предварительной подготовки для применения в конвейере
7.16. Модификация классов библиотеки scikit-learn для работы с датафреймами
7.17. Полный цикл построения конвейера моделей в scikit-learn
7.18. Калибровка модели
7.19. Полезные классы CountVectorizer и TfidfVectorizer для работы с текстом
7.20. Сравнение моделей, полученных в ходе поиска по сетке, с помощью статистических тестов
7.21. Разбиение на обучающую, проверочную и тестовую выборки с учетом временной структуры для валидации временных рядов
7.22. Виды перекрестной проверки для данных формата «один объект – одно наблюдение» (присутствует ось времени)
7.23. Перекрестная проверка для данных формата «один объект – несколько наблюдений» (присутствует ось времени)
7.24. Многоклассовая классификация: подходы «один против всех», «один против одного» и «коды, исправляющие ошибки»
ЧАСТЬ 3. ДРУГИЕ ПОЛЕЗНЫЕ БИБЛИОТЕКИ
1. Библиотеки визуализации matplotlib, seaborn и plotly
1.1. Matplotlib
1.2. Seaborn
1.3. Plotly
2. Библиотека прогнозирования временных рядов ETNA
2.1. Общее знакомство
2.2. Создание объекта TSDataset
2.3. Визуализация рядов объекта TSDataset
2.4. Получение сводки характеристик по объекту TSDataset
2.5. Модель наивного прогноза
2.6. Модель скользящего среднего
2.7. Модель сезонного скользящего среднего
2.8. Модель SARIMAX
2.9. Модель Хольта–Винтерса (модель тройного экспоненциального сглаживания, модель ETS)
2.10. Модель Prophet
2.11. Модель CatBoost
2.12. Модель линейной регрессии с регуляризацией «эластичная сеть»
2.13. Объединение процедуры построения модели, оценки качества и визуализации прогнозов в одной функции
2.14. Перекрестная проверка нескольких моделей
2.15. Ансамбли
2.16. Стекинг
2.17. Создание собственных классов для обучения моделей
2.18. Импутация пропусков
2.19. Работа с трендом и сезонностью
2.20. Обработка выбросов
2.21. Собираем все вместе
2.22. Модели нейронных сетей
2.23. Оптимизация гиперпараметров с помощью Optuna от разработчиков
Ответы на вопросы с собеседований

Отзывы

Все отзывы о книге Предварительная подготовка данных в Python

Чтобы оставить отзыв, зарегистрируйтесь или войдите

другие книги автора

Изучаем pandas

Предварительная подготовка данных в Python

Том 1. Инструменты и валидация

Аннотация

Содержание

Отзывы

Краткая аннотация книги "Предварительная подготовка данных в Python"

Содержание

Все отзывы о книге Предварительная подготовка данных в Python

другие книги автора

С книгой "Предварительная подготовка данных в Python" читают