Daruのメリットを考える

Qiitaに投稿したDaruを使うから主観が強すぎるところをブログに移動しました。

Daruのメリットを考える

データサイエンスのツールとしてプログラミングをやりたい人が気にするのは次のような点だろう。

  • Daruは信頼できるのか?
  • Daruには継続性があるのか?
  • Daruのバグは少ないのか?

 正直に言うと、いずれもあてはまらない。Daruの信頼性はあまり高くなく、熱心に使い始めると小さなバグをそこかしこに見つけることができるだろう。Daruはビジネス上の緊急の問題解決に応えるためのツールではないのである。しかし、Daruのソースコードは小さく、速度に最適化されていないため、詳しくない人でも読むことができる。

 Daruを使ったデータ分析は、ビジネス上の問題を解決することや、Kaggleで高得点を出すことから、少し離れたところにある。一番効率的なツールを使って、最高の手段で問題解決に資したいと思うのは自然なことだ。そして、そのことで周囲から評価されたらなお嬉しいと思うだろう。
 ところが、そうやって問題解決のために自分を最適化することは、よいことばかりではなく、一歩引いて見るとある種過学習のような状態におちいっているケースがある。
 よくもわるくも、Daruにはそのような心配がない。これがRubyでデータ処理をやろうとする隠れたメリットの1つかもしれない。

もちろん、そのようなメリットがあるのは理解できるけれどもデメリットの方が大きいだろう、というのが一般的な考え方だろうなとは思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です