R в действии
книга

R в действии : анализ и визуализация данных с использованием R и Tidyverse

Здесь можно купить книгу "R в действии : анализ и визуализация данных с использованием R и Tidyverse" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Роберт Кабаков

Форматы: PDF

Издательство: ДМК Пресс

Год: 2023

Место издания: Москва

ISBN: 978-5-93700-173-3 (рус.). – ISBN 978-1-61729-605-5 (англ.)

Страниц: 769

Артикул: 108096

Возрастная маркировка: 16+

Электронная книга
1999

Краткая аннотация книги "R в действии"

R – золотой стандарт, ежедневно используемый исследователями по всему миру для самых разных вычислений и статистического анализа данных. Этот свободно распространяемый язык с открытым исходным кодом включает огромное количество пакетов самой разной направленности, от расширенной визуализации данных до глубокого обучения. Чрезвычайно удобный для пользователей с математическим складом ума, R легко решает практические задачи, не заставляя думать о них с точки зрения программиста. Данная книга научит вас выполнять статистический анализ и визуализировать результаты с помощью R и его популярных пакетов; решать такие практические задачи, как прогнозирование, интеллектуальный анализ данных и разработка динамических отчетов. В третье издание добавлены новые сведения о построении диаграмм с помощью пакета ggplot2, а также приводятся примеры из области машинного обучения, такие как кластеризация, классификация и анализ временных рядов. Издание предназначено для широкого круга специалистов по обработке данных.

Содержание книги "R в действии : анализ и визуализация данных с использованием R и Tidyverse"


Предисловие от издательства
Предисловие
Благодарности
Об этой книге
Об авторе
Об иллюстрации на обложке
ЧАСТЬ I. НАЧАЛО РАБОТЫ
1. Знакомство с R
1.1. Зачем использовать R?
1.2. Получение и установка R
1.3. Работа в R
1.4. Пакеты
1.5. Передача вывода на ввод: повторное использование результатов
1.6. Работа с большими массивами данных
1.7. Учимся на примере
Итоги
2. Создание набора данных
2.1. Что такое набор данных?
2.2. Структуры данных
2.3. Ввод данных
2.4. Аннотирование наборов данных
2.5. Полезные функции для работы с объектами
Итоги
3. Основы управления данными
3.1. Рабочий пример
3.2. Создание новых переменных
3.3. Перекодирование переменных
3.4. Переименование переменных
3.5. Пропущенные значения
3.6. Календарные даты
3.7. Преобразования данных из одного типа в другой
3.8. Сортировка данных
3.9. Объединение наборов данных
3.10. Разделение наборов данных на составляющие
3.11. Использование dplyr для работы с таблицами данных
3.12. Использование инструкций SQL для работы с таблицами данных
Итоги
4. Начало работы с диаграммами
4.1. Создание диаграмм с помощью пакета ggplot2
4.2. Особенности пакета ggplot2
Итоги
5. Дополнительные приемы управления данными
5.1. Задача по управлению данными
5.2. Числовые и текстовые функции
5.3. Управление потоком выполнения
5.4. Пользовательские функции
5.5. Агрегирование и реструктуризация данных
5.6. Агрегирование данных
Итоги
ЧАСТЬ II. БАЗОВЫЕ МЕТОДЫ
6. Базовые диаграммы
6.1. Столбиковые диаграммы
6.2. Круговые диаграммы
6.3. Диаграммы «плоское дерево»
6.3. Гистограммы
6.5. Диаграммы ядерной оценки функции плотности
6.6. Коробчатые диаграммы
6.7. Точечные диаграммы
Итоги
7. Основные методы статистической обработки данных
7.1. Описательные статистики
7.2. Таблицы частот и таблицы сопряженности
7.3. Корреляция
7.4. Критерий Стьюдента
7.5. Непараметрические критерии межгрупповых различий
7.6. Визуализация групповых различий
Итоги
ЧАСТЬ III. МЕТОДЫ СРЕДНЕЙ СЛОЖНОСТИ
8. Регрессия
8.1. Многоликая регрессия
8.2. МНК-регрессия
8.3. Диагностика регрессионных моделей
8.4. Необычные наблюдения
8.5. Способы корректировки
8.6. Выбор «лучшей» регрессионной модели
8.7. Продолжение анализа
Итоги
9. Дисперсионный анализ
9.1. Краткий обзор терминологии
9.2. Подгонка ANOVA-моделей
9.3. Однофакторный дисперсионный анализ
9.4. Однофакторный ковариационный анализ
9.5. Двухфакторный дисперсионный анализ
9.6. Дисперсионный анализ повторных измерений
9.7. Многомерный дисперсионный анализ
9.8. Дисперсионный анализ как регрессия
Итоги
10. Анализ мощности
10.1. Краткий обзор проверки значимости гипотез
10.2. Проведение анализа мощности при помощи пакета pwr
10.3. Графический анализ мощности
10.4. Другие пакеты
Итоги
11. Диаграммы средней сложности
11.1. Диаграммы рассеяния
11.2. Линейные графики
11.3. Кореллограммы
11.4. Мозаичные диаграммы
Итоги
12. Статистика повторных выборок и бутстреп-анализ
12.1. Критерии перестановок
12.2. Критерии перестановок в пакете coin
12.3. Критерии перестановок в пакете lmPerm
12.4. Дополнительные замечания о критериях перестановок
12.5. Бутстреп-анализ
12.6. Проведение бутстреп-анализа при помощи пакета boot
Итоги
ЧАСТЬ IV. МЕТОДЫ ПОВЫШЕННОЙ СЛОЖНОСТИ
13. Обобщенные линейные модели
13.1. Обобщенные линейные модели и функция glm()
13.2. Логистическая регрессия
13.3. Пуассоновская регрессия
Итоги
14. Метод главных компонент и факторный анализ
14.1. Поддержка метода главных компонент и факторного анализа в R
14.2. Главные компоненты
14.3. Разведочный факторный анализ
14.4. Другие модели скрытых переменных
Итоги
15. Временные ряды
15.1. Создание объекта временного ряда
15.2. Сглаживание и сезонная декомпозиция
15.3. Экспоненциальные модели прогнозирования
15.4. Модели прогнозирования ARIMA
15.5. Дополнительная информация
Итоги
16. Кластерный анализ
16.1. Общие этапы кластерного анализа
16.2. Вычисление расстояний
16.3. Иерархический кластерный анализ
16.4. Разделяющие методы кластерного анализа
16.5. Исключение несуществующих кластеров
16.6. Дополнительная информация
Итоги
17. Классификация
17.1. Подготовка данных
17.2. Логистическая регрессия
17.3. Деревья решений
17.4. Случайные леса
17.5. Машины опорных векторов
17.6. Выбор лучшего прогностического решения
17.7. Интерпретация прогнозов черного ящика
17.8. Дополнительная информация
Итоги
18. Продвинутые методы работы с пропущенными данными
18.1. Этапы работы с пропущенными данными
18.2. Идентификация пропущенных значений
18.3. Исследование структуры пропущенных данных
18.4. Определение причин отсутствия данных и их влияния
18.5. Рациональный подход к обработке отсутствующих данных
18.6. Удаление пропущенных данных
18.6. Анализ полных строк (построчное удаление)
18.7. Одиночное восстановление пропущенных данных
18.8. Множественное восстановление пропущенных данных
18.9. Другие подходы обработки пропущенных данных
Итоги
ЧАСТЬ V. РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ
19. Продвинутые методы работы с диаграммами
19.1. Управление отображением осей
19.2. Изменение темы оформления
19.3. Добавление аннотаций
19.4. Объединение диаграмм
19.5. Создание интерактивных диаграмм
Итоги
20. Продвинутые приемы программирования
20.1. Обзор языка
20.2. Работа с окружениями
20.3. Нестандартная оценка
20.4. Объектно-ориентированное программирование
20.5. Разработка эффективного кода
20.6. Отладка
20.7. Дополнительная информация
Итоги
21. Создание динамических отчетов
21.1. Шаблонный подход к отчетам
21.2. Создание отчета с помощью R и R Markdown
21.3. Создание отчетов на R и LaTeX
21.4. Преодоление типичных проблем с R Markdown
21.5. Дополнительная информация
Итоги
22. Создание пакетов
22.1. Пакет edatools
22.2. Создание пакета
22.3. Распространение пакета
22.4. Дополнительная информация
Итоги
23. Продвинутая графика с использованием пакета lattice
23.1. Пакет lattice
23.2. Условные переменные
23.3. Функции для изменения формата ячеек
23.4. Группировка переменных
23.5. Графические параметры
23.6. Настройка планок на диаграммах
23.7. Размещение диаграмм на странице
23.8. Дополнительная информация
Послесловие. В погоне за кроликом
Приложение A. Графические пользовательские интерфейсы
Приложение B. Начальная настройка окружения
Приложение C. Экспорт данных из R
C.1. Текстовый файл CSV
C.2. Электронная таблица Excel
C.3. Другие статистические приложения
Приложение D. Матричная алгебра в R
Приложение E. Пакеты, использованные в этой книге
Приложение F. Работа с большими наборами данных
F.1. Эффективное программирование
F.2. Хранение данных вне оперативной памяти
F.3. Аналитические пакеты для больших объемов данных
F.4. Комплексные решения для работы с огромными наборами данных
Приложение G. Обновление версии R
G.1. Автоматизированное обновление R (только для Windows)
G.2. Обновление R вручную (для Windows и macOS)
G.3. Обновление R в Linux
Список литературы
Предметный указатель

Все отзывы о книге R в действии : анализ и визуализация данных с использованием R и Tidyverse

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Внимание!
При обнаружении неточностей или ошибок в описании книги "R в действии : анализ и визуализация данных с использованием R и Tidyverse (автор Роберт Кабаков)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!