Skip to content

【Daru】Rubyでデータ分析【Statsample】

Rubyのデータサイエンスに関するコミュニティはまだ小さいです。これはPythonのような、成熟して手の入る余地の少ないプロジェクトよりも遥かに将来性があり、あなたが貢献する余地がたくさん残されているということを意味します。ワクワクしませんか?
このページは素人がテキトーに書いています。まああれだ。頑張れ。

このページで使うライブラリ

Numo::NArray
数値計算
Numo::Gnuplot
グラフ作成
Statsample
統計
Daru
データフレーム

このページで使わないが重要なライブラリ

・red-arrow
・pycall
・rb-libsvm
・liblinear-ruby

便利なので使っているが好きではないライブラリ

・Jupyter-notebook(Jupyterが嫌いなのではなくて、JupyterでRubyを動かすのが何となく嫌)
・IRuby

人気はあるが本当は性能が低いと感じられるライブラリ

・NMatrix
(性能は低いが、作者の政治力と顕示欲は高い。糞味噌に書いたがScirubyへの貢献は大きく、みんな気を使っていると思われる。※個人の意見です)

ライブラリを読み込む

長いので短縮する

いわゆるやりたい放題。SFloatやDataFrameがトップスペースから呼べたらもっと楽しいが…

楽に配列を作成する

棒グラフを描く

折れ線グラフを描く

ベクトルを生成する

NArray配列を生成する

平均値(mean)

中央値(median)

分散(V:variance)

標準偏差(SD:standard deviation)

歪度・尖度

※Numo::GSLを使えば、NArrayでも求められる

範囲

ターミナル上で基礎統計量を表示する

ターミナル上にヒストグラムを表示する

ヒストグラムをSVG形式で保存する

1標本T検定

F検定

U検定

2標本T検定

箱ひげ図を描く

χ二乗検定

散布図

散布図その2

3D散布図

相関係数を求める

Spearmanの相関係数

単回帰分析

重回帰分析

主成分分析

データフレームを作成する

配列からデータフレームを作成する

行や列の情報を取得する

データフレームに行を追加する

CSVファイルからデータフレームをつくる

Microsoft Excelファイルの読み込み

ActiveRecordから読み込み

データフレームの最初と最後を表示する

データフレームの”列”にアクセスする

データフレームの”行”にアクセスする

データフレームの列名を取得する

ソートする

条件によって行を抽出する

行を削除する

列を削除する

データフレームの行⇔列を入れ替える

欠損値のある行を取り除く

グルーピング/集約

データフレームのマージ

※2017年7月時点ではindexによるjoinは開発中らしい
※mergeはpandasのconcatのaxis=1のような動きをするメソッド(vectorをマージするの意味らしい)

軸による連結

数値ベクトルのみのデータフレームを取り出す

時系列のベクトルを作る

時系列ベクトルからグラフを描く


※ GnuplotRBを使用する

データフレームをCSVに書き込む

ロジスティック回帰

statsample-glmを使用する。信頼性はいまひとつか。

Post a Comment

Your email is never published nor shared. Required fields are marked *
*
*