通称: 「宇宙本」
初心者(Rを使い始めた、ちょっと触ったことがある方)向けの内容です
install.packages()
でインストールreadr パッケージの read_csv() 関数を使いたいとき
ざっくり:
install.packages("tidyverse")
でインストール── Attaching packages ───────────────────────────────── tidyverse 1.2.1 ──
✔ ggplot2 3.1.0 ✔ purrr 0.3.2
✔ tibble 2.1.3 ✔ dplyr 0.8.1
✔ tidyr 0.8.3 ✔ stringr 1.4.0
✔ readr 1.3.1 ✔ forcats 0.4.0
── Conflicts ──────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
読み込まれるパッケージ
パッケージを使わないやり方より
2つのデータ形式(例: カテゴリごとの購買金額(千円))
git clone https://github.com/ymattu/sampledata_small
sales <- read_csv("sampledata_small/csv/Sales.csv")
product <- read_csv("sampledata_small/csv/Products.csv")
user_master <- read_csv("sampledata_small/csv/UserMaster.csv")
データ読み込みについて詳しくはこちらも参照
[1] 6
結果 <- スタート地点
を書いて、やりたい処理をパイプでつないでいく
例
$
はお手軽だしよく使います。$
で 1 列だけ取り出す[1] "雑貨・日用品" "花・グリーン"
[3] "食品" "衣料品"
[5] "ヘルス&ビューティー" "家具・インテリア・家電"
[1] "2011-06-04"
[1] "2013-01-01"
たくさんあるけど例えば
ユーザー、年ごとに集計
inner_join()
left_join()
full_join()
anti_join()
Answer : C++を使っているから
例えばこんな感じ(a, b, c 3 つのデータ)
x1 x2
1 A 1
2 B 2
3 C 3
x1 x3
1 A TRUE
2 B FALSE
3 D TRUE
x1 x4
1 B 10
2 C 11
3 D 12
こうする…?
数が増えると大変!Answer : 初心者セッションの範囲をこえますが、
purrrパッケージを使うと簡単です。
purrr パッケージの参考資料→そろそろ手を出す purrr
tidyverse
は必須