Статистический анализ и визуализация данных с помощью R [В. К. Шитиков] (pdf) читать постранично

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

Мастицкий С. Э., Шитиков В. К.

Статистический анализ
и визуализация данных
с помощью R

Москва, 2015

УДК 311:004.9R
ББК 60.6с515
М32

Мастицкий С. Э., Шитиков В. К.
М32 Статистический анализ и визуализация данных с помощью R. – М.: ДМК
Пресс, 2015. – 496 с.: цв. ил.
ISBN 978-5-97060-301-7
Сегодня язык R является безусловным лидером среди свободно распространяемых систем
статистического анализа. Ведущие университеты мира, аналитики крупнейших компаний и исследовательских центров регулярно используют R при проведении научно-технических расчетов
и создании крупных информационных проектов. Широкое преподавание статистики на базе этой
системы и всемерная поддержка научным сообществом обусловили то, что приведение скриптов
кода на языке R постепенно становится общепризнанным стандартом как в журнальных публикациях, так и при неформальном общении ученых всего мира. Настоящая книга дополняет небольшую
(пока) коллекцию работ по R на русском языке, обобщая и значительно расширяя совокупность
методических сообщений, опубликованных ранее одним из авторов в блоге «R: Анализ и визуализация данных» (http://r-analytics.blogspot.com).
Книга адресована студентам, аспирантам, а также молодым и состоявшимся ученым, желающим
освоить классические и современные методы анализа данных с использованием языка R.

УДК 311:004.9R
ББК 60.6с515
Все права защищены. Любая часть этой книги не может быть воспроизведена в какой
бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав.
Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность
технических ошибок все равно существует, издательство не может гарантировать абсолютную
точность и правильность приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги.

ISBN 978-5-97060-301-7

© Мастицкий С. Э., Шитиков В. К., 2015
© Оформление, издание, ДМК Пресс, 2015

Посвящаю эту книгу своим родителям.
Сергей Мастицкий

Всем заинтересованным читателям,
без которых книги вообще не имеют смысла...
Владимир Шитиков

Содержание
Предисловие ......................................................... 10
Глава 1. Основные компоненты статистической
среды R ................................................................ 13
1.1. История возникновения и основные принципы организации среды R ............13
1.2. Работа с командной консолью .........................................................................................17
1.3. Работа с меню R Commander ............................................................................................20
1.4. Объекты, пакеты, функции, устройства .......................................................................24

Глава 2. Описание языка R ....................................... 31
2.1. Типы данных ..........................................................................................................................31
2.2. Векторы и матрицы .............................................................................................................32
2.3. Факторы ..................................................................................................................................38
2.4. Списки и таблицы данных ................................................................................................40
Заполнение пустых значений...........................................................................................45
Сортировка таблиц ..............................................................................................................46
Объединение таблиц ...........................................................................................................46
2.5. Импортирование данных в R ...........................................................................................47
2.6. Представление дат и времени. Временные ряды ......................................................51
Форматы представления дат и времени .......................................................................51
Вычисления с датами и временем...................................................................................52
Преобразование текстовых переменных в машинный формат времени ..........53
Временные ряды ...................................................................................................................54
2.7. Организация вычислений: функции, ветвления, циклы .......................................56
Написание собственных функций ..................................................................................57
Условия и циклы ...................................................................................................................59
2.8. Векторизованные вычисления в R .................................................................................61

Глава 3. Базовые графические возможности R ............ 70
3.1. Функция plot() и ее параметры .....................................................................................70
Управляющие параметры функции plot() ..................................................................73
Общие аргументы графических функций ...................................................................74
3.2. Гистограммы, функции ядерной плотности и функция cdplot() ........................79
3.3. Диаграммы размахов ...........................................................................................................87
3.4. Круговые и столбиковые диаграммы ............................................................................91

Содержание  5
3.5. Диаграммы Кливленда и одномерные диаграммы рассеяния .............................99
3.6. Категоризованные графики ........................................................................................... 107

Глава 4. Описательная статистика, подгонка
распределений и смежные задачи ...........................114
4.1. Базовые функции для расчета параметров описательной статистики