Изучаем pandas
книга

Изучаем pandas : высокопроизводительная обработка и анализ данных в Python

Здесь можно купить книгу "Изучаем pandas : высокопроизводительная обработка и анализ данных в Python" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Майкл Хейдт, Артем Груздев, Артём Груздев

Форматы: PDF

Издательство: ДМК Пресс|Гевисста

Год: 2019

Место издания: Москва

ISBN: 978-5-97060-670-4

Страниц: 683

Артикул: 94699

Возрастная маркировка: 16+

Электронная книга
1190

Краткая аннотация книги "Изучаем pandas"

Библиотека pandas – популярный пакет для анализа и обработки данных на языке Python. Он предлагает эффективные, быстрые, высокопроизводительные структуры данных, которые позволяют существенно упростить работу. Данная книга познакомит вас с обширным набором инструментов, предлагаемых библиотекой pandas, – начиная с обзора загрузки данных с удаленных источников, выполнения численного и статистического анализа, индексации, агрегации и заканчивая визуализацией данных и анализом финансовой информации. Издание предназначено всем разработчикам на языке Python, интересующимся обработкой данных.

Содержание книги "Изучаем pandas : высокопроизводительная обработка и анализ данных в Python"


Предисловие
Глава 1. Библиотека pandas и анализ данных
Знакомство с библиотекой pandas
Обработка данных, анализ, наука и библиотека pandas
Процесс анализа данных
Взаимосвязь между книгой и процессом анализа данных
Понятия «данные» и «анализ» в контексте нашего знакомства с библиотекой pandas
Другие библиотеки Python, работающие вместе с библиотекой pandas
Выводы
Глава 2. Запуск библиотеки pandas
Установка Anaconda
IPython и Jupyter Notebook
Знакомство со структурами данных библиотеки pandas – Series и DataFrame
Выводы
Глава 3. Представление одномерных данных с помощью объекта Series
Настройка библиотеки pandas
Создание объекта Series
Свойства .index и .values
Размер и форма объекта Series
Установка индекса во время создания объекта Series
Использование методов .head(), .tail() и .take() для вывода значений
Получение значений в объекте Series по метке или позиции
Создание срезов объекта Series
Выравнивание данных по меткам индекса
Выполнение логического отбора
Переиндексация объекта Series
Модификация объекта Series на месте
Выводы
Глава 4. Представление табличных и многомерных данных с помощью объекта DataFrame
Настройка библиотеки pandas
Создание объектов DataFrame
Доступ к данным внутри объекта DataFrame
Логический отбор строк
Одновременный отбор строк и столбцов
Выводы
Глава 5. Выполнение операций над объектом DataFrame и его содержимым
Настройка библиотеки pandas
Переименование столбцов
Добавление новых столбцов с помощью оператора [] и метода .insert()
Добавление столбцов за счет расширения датафрейма
Добавление столбцов с помощью конкатенации
Переупорядочивание столбцов
Замена содержимого столбца
Удаление столбцов
Присоединение новых строк
Конкатенация строк
Добавление и замена строк за счет расширения датафрейма
Удаление строк с помощью метода .drop()
Удаление строк с помощью логического отбора
Удаление строк с помощью среза
Выводы
Глава 6. Индексация данных
Настройка библиотеки pandas
Важность применения индексов
Типы индексов библиотеки pandas
Работа с индексами
Иерархическая индексация
Выводы
Глава 7. Категориальные данные
Настройка библиотеки pandas
Создание категориальных переменных
Переименование категорий
Добавление категорий
Удаление категорий
Удаление неиспользуемых категорий
Установка категорий
Вычисление описательных статистик для категориальной переменной
Обработка школьных оценок
Выводы
Глава 8. Численные и статистические методы
Настройка библиотеки pandas
Применение численных методов к объектам библиотеки pandas
Выполнение статистических операций c объектами библиотеки pandas
Выводы
Глава 9. Загрузка данных
Настройка библиотеки pandas
Работа с CSV-файлами и текстовыми/табличными данными
Чтение и запись данных в формате Excel
Чтение и запись JSON-файлов
Чтение HTML-файлов из интернета
Чтение и запись HDF5-файлов
Загрузка CSV-файлов из интернета
Чтение из базы данных SQL и запись в базу данных SQL
Загрузка данных с удаленных сервисов
Выводы
Глава 10. Приведение данных в порядок
Настройка библиотеки pandas
Что такое приведение данных в порядок?
Как работать с пропущенными данными
Обработка дублирующихся данных
Преобразование данных
Выводы
Глава 11. Объединение, связывание и изменение формы данных
Настройка библиотеки pandas
Конкатенация данных, расположенных в нескольких объектах
Слияние и соединение данных
Поворот данных для преобразования значений в индексы и наоборот
Состыковка и расстыковка данных
Преимущества использования состыкованных данных
Выводы
Глава 12. Агрегирование данных
Настройка библиотеки pandas
Обзор схемы «разделение–применение–объединение»
Данные для примеров
Разделение данных
Применение агрегирующих функций, преобразований и фильтров
Выводы
Глава 13. Анализ временных рядов
Настройка библиотеки pandas
Представление дат, времени и интервалов
Введение во временные ряды
Вычисление новых дат с помощью смещений
Представление промежутков времени с помощью объектов Period
Обработка праздников с помощью календарей
Нормализация временных меток с помощью часовых поясов
Операции с временными рядами
Применение к временному ряду операций на основе скользящего окна
Выводы
Глава 14. Визуализация
Настройка библиотеки pandas
Основные инструменты визуализации
Создание графиков временных рядов
Виды графиков, часто использующиеся в статистическом анализе данных
Размещение нескольких графиков на одном рисунке вручную
Выводы
Приложение 1. Советы по оптимизации вычислений в библиотеке pandas
Приложение 2. Улучшение производительности pandas (из официального пособия по библиотеке pandas)
Приложение 3. Используем pandas для больших данных
Приложение 4. Пример предварительной подготовки данных в pandas (конкурсная задача Tinkoff Data Science Challenge)
Приложение 5. Пример предварительной подготовки данных в pandas (конкурсная задача предсказания отклика ОТП Банка)
Приложение 6. Работа с датами и строками
Приложение 7. Работа с предупреждением
SettingWithCopyWarning в библиотеке pandas
Приложение 8. От Pandas к Scikit-Learn – новый подход к управлению рабочими процессами
Предметный указатель

Все отзывы о книге Изучаем pandas : высокопроизводительная обработка и анализ данных в Python

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Внимание!
При обнаружении неточностей или ошибок в описании книги "Изучаем pandas : высокопроизводительная обработка и анализ данных в Python (автор Майкл Хейдт, Артем Груздев, Артём Груздев)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!