ビッグデータ活用するには情報が正しい必要があるよね...

以前20年後には精神科医がいなくなり始めるといった内容を書いてまあまあ読んでくださっている方もいるようで有り難いのだが、幾つかビッグデータとかAI系のサイトや解説本を読んで考えることを。


cs.sonylife.co.jp


AI活用例として、遺伝子解析、総合診療支援、画像診断、医薬品開発を挙げている。この中で、画像診断に関しては早く進んで欲しい。画像は基本的に嘘付かないからAIがバカ正直に画像を溜め込んで沢山の例から正確な画像診断技術を磨いてくれればいいなあと思う。日常的に参考にできればどれだけ心強いか。


さて、AIが進行して診断をバシバシとやっていく中で医師が必要じゃなくなるのは怖くないが(それは社会としては歓迎すべきことだし)、間違った情報を正しいと誤認したまま蓄積していってそれをもとに重要な医学判断や研究の方針を立ててしまうことは避けて欲しい。今後は研究テーマだってAIが考えることがあり得るのだろうけど、参照するデータが間違っていたらどんなに良いテーマも結果を出すことが出来ない。


遺伝子解析に関しては、これまでも述べたとおり結構な危惧を持っている。というのは、AIが参照するであろう遺伝子解析論文には相当程度、質に問題があるだろうから。遺伝子が絡む研究では特に出版バイアス、つまり研究結果がネガティブだったときに出版されていないということが多い。さらに、論文の記述を詳細に分析できるようになったAIに気をつけて欲しいのは、論文著者が、結果が正しいことを最大限にアピールするために、過去文献の引用や結果の解釈にかなりバイアスをかけて記述していることだろう。実際、まだ入学したばかりの、でもとても意欲的な大学院生は沢山の論文を読むのは良いけど、著者の書くがまま全部の記述をそのまま信じ、懐疑的に読むということを知らない。ま、賢いAIさんはこんな危惧を凌駕するだけの実力を持つのかもしれないが...。*1


とりあえずスーパー研修医さんがそばにいる気分にさせて欲しい
精神科医の恐怖は、目の前の人の精神症状を精神疾患と診断しておきながら後に身体に原因のある器質性疾患であることが判明することだ。当然、似たような症状を引き起こす身体の病気を念頭に置くのだが、果たして自分は考え尽くしたのか、に自信が持てないことだってある。多分将棋や碁の棋士も一手指す(打つ)ときに同じような気持ちになっているのではなかろうか。


techon.nikkeibp.co.jp


これから先、医者が要らなくなる世界が出て来るにせよ、当面は(10年くらいでしょうかね)生身の医者の作業がストレスフリーになる過渡的状況が生まれるはず、というのを考えると、この「ホワイト・ジャック」はいいんじゃないかなと。問診状況から様々なデータにアクセスして、鑑別疾患やら必要な検査、とりわけ本来頭に上らせなければいけないのに抜けがちな珍しい疾患の可能性など挙げてくれるという。NHKドクターGで回答するような優秀な研修医さんが傍にいてくれるようなものだ。デキる研修医は、国試からまだ日が浅く、その知識は辞典のように情報量があり、かつどんな可能性も考えるほど偏見がない。脇に居てくれたら非常に役にたつ。*2


ベテラン医師になるほど思いつく疾患名は少なくなる。それはメジャーな疾患が結局は溢れていることもあるし、ある意味、将棋の羽生さんの言う「捨てる力」や「大局観」につながるもので、正解に至る時間を節約してはいる。だが、時に間違うし、自信が無いことも多い。そんな時参照できるAIがあれば。


確かな情報の蓄積がAI医療成功への鍵だろう


AIが参照するのはいわゆるビッグデータというやつだ。
そのデータの蓄積が日本は他の先進国に比べてとても弱い、というのが残念。


国内の代表的な医療データベースは厚労省のNDB(National Database)。電子レセプトの情報を集めたアーカイブだ。ちなみにレセプトは保険診療の明細書のことで、各医療機関は保険請求のためにその情報を電子データで保険組合に送っている。それは保険診療情報を元にしており、何せ日本は皆保険だから保険診療情報を追うことで、ほぼすべての受診者に対する治療動向を探ることができる。ただ、生活保護は対象外となるし、診断名は出したい薬に応じて保険病名がつけられるために実際の医学的診断と異なっている場合も多く、あらゆる情報を信用できるわけでもない。また、データは無料で利用可能だが利用制限が強く、解析はエンジニアさんの助けを借りないと難しいなど、1人の人間が助けなしに使うにはちょっと(かなり)ハードルが高いのが困ったところ。厚労省にアクセスしてコレコレが欲しいのですとお願いして向こうが表にまとめてくれるのを待たなければいけないとか、事前に研究計画を立ててから要求とか、ハードルが高いと参照する気も失せる...と思うのだが、でも公開しているオープンソースもあり、これはこれでちゃんと見ると面白そうだ。*3


      第1回NDBオープンデータ


一方でNCD(National Clinical Databese)は日本外科学会を中心に各外科系学会が協力して作り上げている外科手術のデータベースで、4000を超える日本の施設があらゆる外科手術についての細かいデータを収集している。こちらのほうは、外科手術と対象が限定されているし、手術はわかりやすい結果がついてくるものだから、基本的に正確に内容が登録される。NDBに比べてその精度が高い、と言えるだろう。国際的にも評価が高い。


   NDB(National Clinical Database)について(代表理事挨拶)


精神科でこんなデータベースができればいいと思うが...なかなか。
やはり結果が明確な外科系のほうが情報の確度が良い気はする。


人工知能の核心 (NHK出版新書 511)

人工知能の核心 (NHK出版新書 511)


AI系の本で是非紹介したいのは将棋の羽生三冠のこの本。以前NHKで羽生さんが取材するという体でスペシャルが放映されたが情報量が薄かった。あの羽生さんに、AIが結果として人間らしい将棋ができたとしても、「接待将棋」みたいなものはハードルが高いのではないか、と言われるとそうかな、と思う。何せ羽生さんは100人を相手に指導的将棋を指せる人なのだ(⇛羽生善治竜王(当時)の100面指し)。全体にはAIの発展を非常に肯定的に感じておられているようだ。


ところで、ロボットの倫理の問題も取り上げられる。いわゆるフレーム問題だ。要するに倫理的判断を求められた時にどう決断するのが正しいのか、ということだと理解している(単純すぎかな?)。


有名な例としては、
トロッコのブレーキが故障し、このまま進むと目の前の5人を轢いてしまうので分岐でハンドルを切らなければいけないが、その先には1人がいるのでやはり轢いてしまう。どう判断すべきか?といった問題。
ここで倫理的判断が求められ、それが解けないからAIの普及にはまだ困難が...云々みたいな話の展開が多いのだが、まあ何というか観念的過ぎて、これが解決しないとAI普及させられないなんてのは困るといつも思う。そもそも人間はこういった答えのない状況に至ると、正直迷ったまま流れの中で何も決断できずに悲惨な状況に陥ることが大半だ。一方で、もし決断をすれば、それは状況からしてどちらが適切だったのかと批評を受けることになるが、十分に周囲から信頼を置かれている人の場合には、帰結が思わしくなくても納得されるのではないか。あの人でそれならしょうがない...と。AIの判断なら大丈夫、という感覚が芽生えないとダメってことですかねえ。


フレーム問題の状況をもう1つ。羽生さんの本から取ると、「橋の上で知らない人と立っているとします。その下では5人の人間に向かってトロッコが暴走しています。トロッコを止めるためには、橋の上から隣の人を突き落とさなければいけない」という設定。他人を突き落とすという判断に多くの人が躊躇する。
でも自分が落ちてもいいんだよなと思ったりするわけです。自分の所有者を犠牲にさせるAIという発想は探したけど見つけられず。

塩狩峠 (新潮文庫)

塩狩峠 (新潮文庫)


先の状況、何かで...と思ったら三浦綾子の「塩狩峠」ですね。
まだ純粋だった頃、三浦綾子の文章がとても心に響いたことを思い出す。今読むと、三浦さんの描く男性ってちょっと煩悩が欠けすぎていないかと皮肉りたくもなるけど...(心が汚くてすみません)。中学生に読んで欲しい。

論文捏造 (中公新書ラクレ)

論文捏造 (中公新書ラクレ)


以前も紹介したが、ScienceやNatureといった名だたる科学誌がヘンドリック・シェーンという1人のドイツ人にすっかり騙されて、捏造されたデータを基に書かれた論文を幾つも載せまくったことがある。発覚は、グラフ中の点が複数の論文で使いまわされていることに、ある学者が気づいたことがきっかけだった。AIがこういうのに気づいてくれればいいのだけど。
ちなみに論文捏造数のチャンピオンは日本人麻酔科医(⇛http://d.hatena.ne.jp/kojitaken/20141018/1413563946)。その数なんと172本!それだけの論文捏造ができるなら本物も書けるだろうに...。

*1:ちなみに自分の主張を補強するために論文を引用することは至って普通のことで、もちろん反対意見も書くが普通は控えめにである。どちらかと言えば読者が、このテーマだったら、とかこの研究グループだったらこう書くよねと著者の立場を忖度して(笑)読むものだ。

*2:だから病院で研修医に当たったらそれは得したというもの。それに大抵研修医さんは優しい(ベテランも優しくなければいけないはずだけど...)。そんな研修医さんも3年目にもなると、経験を積んで、なんでも治せると思うほど傲慢になることが多い。denuroもその頃上司に「君は今なんでも出来るって思っている年頃だよね?」と言われたりした。しばらくするとやっぱりだめだと落ち込むものでもありますが。

*3:精神科分野にもNDBを参照にした優れた研究があり、この分野の第一人者の1人、奥村氏の業績はとても興味深い⇛ 奥村泰之の情報公開 例えば、古いタイプの睡眠薬を大量服薬した患者は、ICU(集中治療室)に入る期間が長く、誤嚥性肺炎の発症リスクも突出して高いと言う研究があったり(https://www.ihep.jp/news/popup.php?seq_no=778)して、今度紹介します。