325 Views
February 25, 22
スライド概要
データサイエンス演習(R システムを使用)
https://www.kkaneko.jp/cc/rd/index.html
金子邦彦研究室ホームページ
https://www.kkaneko.jp/index.html
金子邦彦(かねこくにひこ) 福山大学・工学部・教授 ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko
rd-8. クラスタリング データサイエンス演習 (R システムを使用) https://www.kkaneko.jp/de/rd/index.html 金子邦彦 1
rd-8. クラスタリング (Rシステムでデータサイエンス演習) https://www.kkaneko.jp/cc/rd/index.html 金子邦彦 2
クラスタリング • 集団が2つ以上 (外れ値とは違う) 3
クラスタデータの合成の例 集団が2つ x <- rnorm(100000, mean=5, sd=5) y <- rnorm(100000, mean=5, sd=5) x2 <- rnorm(80000, mean=-15, sd=1) y2 <- rnorm(80000, mean=-2, sd=1) x3 <- c( x, x2 ) y3 <- c( y, y2 ) n <- floor( runif(100, 1, 180000+1) ) d12 <- data.frame( xx=x3[n], yy=y3[n] ) library(ggplot2) ggplot(d12, aes(x=xx)) + geom_point( aes(y=yy), size=3 ) + theme_bw() ※ c は、ベクトルデータの連結 4
mclust パッケージを使うには • 準備 インターネット接続が必要 • インストール install.packages("mclust") 5
クラスタリングの例 library(mclust) c <- Mclust(d12, modelNames="VVV") print(c$classification) 6
クラスタリングの結果を,色付きの散布図 でプロット library(mclust) c <- Mclust(d12, modelNames="VVV") print(c$classification) library(ggplot2) ggplot(d12, aes(x=xx)) + geom_point( aes(y=yy), size=3, col=c$classification ) + theme_bw() 7