Аналитика в Power BI с помощью R и Python [Райан Уэйд] (pdf) читать постранично, страница - 17

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

визуализации для приведения данных к нужному вам формату.
Концепция приведения исходной информации к «чистому» формату занимает важное место при анализе и визуализации данных, и это касается не
только языка R. Подробное освещение этой темы выходит за рамки данной
книги. К счастью, Хэдли Уикхэм написал прекрасную инструкцию по «очищению» данных, которую можно загрузить по адресу https://vita.had.co.nz/
papers/tidy-data.pdf.

Популярные геометрии
Как мы уже раньше говорили, пакет ggplot2 основан на теории многослойной
грамматики графиков. Слои добавляются в визуальные элементы посредством вызова функций семейства geom. Эта особенность позволяет строить
поистине прекрасные визуализации с минимумом кода, довольно простого
для понимания. Выбранный подход способствует гораздо более легкому воплощению своих идей при помощи визуализации в сравнении с другими
языками программирования. В пакете ggplot2 вашему вниманию представлено великое множество геометрий, и в данной главе мы рассмотрим и приведем примеры наиболее популярных из них.
  geom_bar(). Функция geom_bar() используется для построения привычных всем нам вертикальных и горизонтальных столбчатых диаграмм (bar chart). Посмотрим на примере, приведенном ниже, как
можно создать простую столбчатую диаграмму при помощи функции
geom_bar():

Популярные геометрии  59
library(tidyverse)
plot.data %
group_by(Class) %>%
summarize(`Total Freq` = sum(Freq))
ggplot(plot.data, aes(x = Class, y = `Total Freq`)) +
geom_bar(stat = "identity") +
labs(title = "geom_bar") +
theme_minimal()

Визуализация, полученная в результате запуска этого скрипта, показана на рис. 1.12.

Рис. 1.12  Геометрия geom_bar()

В первой строке кода происходит загрузка набора пакетов tidyverse.
Далее выполняется подготовка набора данных для визуализации при
помощи функции geom_bar(). Техника преобразования данных, используемая в этом примере, будет подробно обсуждаться далее в книге.
После этого следует блок создания визуализации. По сути, первых двух
строк этого блока достаточно, чтобы построить столбчатую диаграмму.
Последние две строки блока призваны навести красоту в визуализации. В них на диаграмму выводится нужный нам заголовок и меняется
тема на минимальную.
Обратите внимание, что функции geom_bar() достаточно передать
единственный аргумент stat для корректного создания геометрии.
Остальные аргументы (набор данных, а также оси x и y) в данном случае
наследуются от функции ggplot(). Присвоение параметру stat значения

Powered by TCPDF (www.tcpdf.org)

60  Грамматика графиков
«identity» говорит пакету ggplot2 о том, что высоты столбиков должны
быть ассоциированы со значениями полей, связанных с эстетикой y
в функции aes(). По умолчанию используется количество элементов
в каждой группе. Подробнее об аргументе stat и его значениях мы поговорим в следующих примерах.
  geom_histogram(). Функция geom_histogram(), как ясно из названия, используется для построения гистограмм. Гистограммы представляют
собой диаграммы распределения значений. Взгляните на код, используемый для создания гистограммы с помощью функции geom_histogram():
library(tidyverse)
set.seed(50)
probs