Orangeすごいなあと思った

世間ではCloud AutoMLが流行しているようだ。

Google先生の戦略は「生産手段の私的所有が基本となっており、生産手段を持つ資本家が労働力を購入して商品を生産する。」みたいな大昔マルクス先生が主張された世界観を一世紀遅れで実現しているような気がして、あまり好きになれない。

生産手段を誰もが手にするためには、データセンターをみんなが作れるようになる必要があり、誰でもCPUを生産できるようにする必要がある。けれども、さまざまな政治的な思惑から、技術を禁止しようとする動きがあちこちで起きているようである。

これはそんなにおもしろい話ではない。なので注目している人が少ないであろうOrangeの話を書く。

Orangeは、スロベニアの リュブリャナ大学が開発しているScikit-Learn, Numpy, ScipyなどをGUIで操作できるようにするラッパーである。Githuのリポジトリをちらっと見た感じだと、全部Pythonで書かれているようだ。

なぜOrangeを知ったかというと、Anaconda-Navigatorがゴリ押ししてきたからである。ゴリ押しだなあ!と思ったので最初はいい印象がなかったが、とあることから使ってみて「これはすごい」と思った。

少なくとも、僕のようなど素人が、せこせことPythonやRubyのコードを、拾ってきてはJupyterにコピペするよりも、遥かに高速にかつ確実に解析ワークフローが作れるのである。Orangeが実現したUIは、将来的にどこか大企業が製品を発表して、Excelのように普及していくのではないだろうかと思った。MSがパトロンをやっているAnacondaがOrangeをゴリ押ししているので、Microsoft製品がそっちの方向に進化していく可能性もありそうだ。

しかし「すごい」と「普及」はまったく次元の違う話である。OrangeはPythonですべてGUIを書いている。ここから想像されるように、動作はもっさりしており、信頼性はあまり高い感じではない。そういうわけでOrange自体が今の形で普及することはないだろう。

なによりもスロベニアの大学が開発しているところが厳しい。プロダクトが普及するかどうかは、そのプロダクトの最初のコンセプトの輝きよりも、開発団体の体力で決まってしまうところが大きい。たとえ開発が継続できても、より大きなプロジェクトがやってきて飲み込まれてしまう。

そういうわけでOrangeは10年後にはなくなっている可能性が高いとは思うけど、言いたい。私はすごいと思いました。

どうしてOrangeがマイナーな存在なのか、ということを考えると、「データのローカリティ」ということが思い浮かぶ。Ruby用のクラスタ計算ソフトPwrakeでもデータのローカリティが計算速度に大きな影響を及ぼすとしている。ゲノム解析ではデータのサイズが大きすぎるので、データのダウンロードが一番大変な作業である。

OrangeはWebを用いたGUIではなく、Qtを使用している。もちろんsshでX11を使うという方法もあるかもしれないが、このソフトウェアは、基本的には手元のPCで手元のデータを処理することを考えているといっていいだろう。

私たちは、データは価値そのものだという現代的な価値観に染まりすぎているので、データのローカリティについて考える時、どうしても何か感情が邪魔をする。そんなことを考えた。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です