Kaggleの肺癌検出コンテストで医用画像のAI活用は大きく広がるのでは

投稿者: | 2017年5月23日

 気が付かないうちに、Kaggleが胸部CTの肺癌検出のコンテストを開催しとった。完全にフォロー不足で、今日発見して目が点になった。これ、ググっても日本じゃあんまり反響ないみたいだけど、ものすごいことだぞ……。どのぐらい凄いかっていうと、これからの医療にとってガラケーしかなかった世界にiPhoneが発表されるぐらいの衝撃になるんじゃないか。IT業界の反応が薄いのは仕方ないとして、ググっても日本の医療クラスタから反応が全然なくてびびる。まさか重要性に気がついていないのか。。そんなわけないよね。それでもgoogle検索でひっかかるのは中国語のサイトばかり。日本の医療は本当に大丈夫かいな。。これあとでしっかり調べないと。

追記①

 kaggleの何が凄いかというと、個人情報の塊である医用画像を大量に使用してコンペティションを開催したことだ。どうやってそんなことができるのかちょっと想像がつかない。けれども、Data Science Bowlのスポンサーをみると、このコンペティションは以前から周到に準備されたものだと思われる。まず、主催はKaggle(Googleによって買収)と、ブーズ・アレン・ハミルトンというコンサルティング会社である。ブーズ・アレン・ハミルトンは日本語Wikipediaによると米政府のコンサルティングに特化しているという。協賛企業をみると、Amazonの名前もあるし、NVIDIAの名前もある。アメリカ合衆国福祉省、アメリカ食品医薬品局の名前も入っている。かなり公共性の強い企画だということが感じられる。
 医療関係からは、アメリカ放射線医学会やアメリカ国立がんセンター、デンマークや、オランダの大学病院の名前がみつかる。Data Support Providers の一番上には、National Lung Screening Trial というものがある。これが今回提供されたデータの中心になっているのだろうか。2002年から2009年頃に行われた治験である。

 興味深いことに、呼吸器学会の名前は見当たらない。このことは何かを物語っている気がする。

 もしも、日本で同じことをやろうと思うなら、AmazonやNVIDIAの他に、ソフトバンク、PFN、さくらインターネット、東芝メディカルなど協賛を取り付け、放射線医学会、国立がんセンターの協力を得て、いくつかの大病院の協力ももらい、できれば台湾などの海外の病院にも協力してもらう。もちろん厚生労働省のお墨付きももらって、有力な財団の協賛ももらう。
 そして多くの患者に、治験で撮影した自分のデータをインターネット上に公開して利用することについてサインする必要がある。はっきり言ってこれはかなり難しいと思う。まず、大病院などの組織や、学会には柔軟な行動は全く期待できない。次に、個人情報を開示する時点で世間の大変な反発が予想される。まして企業が莫大な懸賞金を用意するという話になると、もう大反発が巻き起こるだろう。その気持ちは、私も日本人なのでわからなくもない。しかし、どうも個々人の利益や安心感を守りすぎるあまりに、長期的な公共の利益や、自分以外の人の利益、技術の発展に対して、冷やかというか、無関心すぎるのではないかという気がする。人の気持ちを考えろって、確かに目の前の人の気持ちは大事だけど、10年後、20年後の未来の日本やアジアで同じ病気になる人の命についてどう考えているのだろうか?目の前の人がよければ、未来の人たちのことはどうでもよいのだろうか?そんなことはないと思う。

 Kaggleがこんなおっかないコンテストを実施できるのも、ちゃんと真剣に医療やアメリカの未来のことを考えているからだと思う。

 もっと勇気をだして医療情報を公のために公表してほしいと思うけど、なかなかそうはならないだろう。あるいは、アメリカでは日本のように医療費が安くないから、治験で医療情報をくれれば、費用を負担しますというな実効力のある仕組みになってるのかもしれない。少なくとも私は、自分が病気になった時はデータを公開したい。死んだらデータはいらないのでインターネット上に無償で公開して、無数の研究者がそれで研究してくれて、世のために役立つ方がずっといいに決まってる。そう思う人だって決して少なくはないはずだ。

 Gmailのようなクラウド方式で、IT企業が患者のデータを没収し、そのかわりに診断やら治療を提供するビジネスモデルってどうも感じ悪いのよね。無料(Free)って、データ押収しているんだから本当は自由でもないし無料でもないよ。

 でもそんなこと普通の人は気がつかない。気がついていても、便利だったらOKだって考えている人も多い。

 そうやってデータを吸収して世界中から優秀な若者をおびき寄せるGoogleの作戦はいつも成功しているから、医療の世界でもそれがうまくいってしまう可能性はあると思う。

追記②
 社会的な凄さについて書いたが、技術的に凄いと思うのは、DICOMデータに対して機械学習を行うという事に関するコードがGithubに多数公開されたこと。
 これで医用画像の機械学習に必要なツールや方法論が大きく改善されたはずだ。多くのデータサイエンティストがDICOM画像を生まれて初めて扱ったことだろう。
 医療側からみると、その気があればデータサイエンティストが作って公開している成果を、その場で日常臨床に試すこともできる環境が整いつつあるということを意味する。
 医用画像のAI認識をめぐる環境はこの1年で激変するのではないかという気がする。できれば、独自路線で頑張るよりも、できるだけ世界の潮流に参加して合わせていった方が大きなメリットがあるような気がする。

追記③
 LUNA16というプロジェクトが前身になっており、Grand Challenges in Biomedical Image Analysisという団体が地道な活動をしている。Kaggleのコンテストは突然発生したのではなく、もっと小規模なコンペティションの積み重ねの中から生まれてきたことがわかる。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です