Овладейте искусством превращения необработанных первичных данных в плодотворные догадки, гипотезы и новые знания с помощью языка R. Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse — коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных. Книга ориентирована на читателей, не имеющих предварительного опыта программирования, и предназначена для того, чтобы помочь им в как можно более короткие сроки начать решать задачи науки о данных.
Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов. Прочитав книгу, вы получите цельное представление как о процессе анализа данных в целом, так и об основных инструментах, используемых при его проведении.
Основные темы книги:
- Предварительная обработка данных — преобразование наборов данных к виду, удобному для анализа.
- Программирование — освоение мощных инструментов R, упрощающих анализ данных и делающих его более понятным.
- Разведочный анализ — исследование данных, выдвижение и быстрая проверка гипотез.
- Моделирование — предоставление сжатых сводных данных, отражающих выявленные тенденции в наборе данных.
- Обмен информацией — изучение языка R Markdown, обеспечивающего интеграцию описательного текста, кода и результатов анализа.
Хэдли Уикем — старший научный сотрудник компании RStudio и член организации R Foundation.