総合格闘技としての医療AI:フルスタックデータサイエンティストの必要性?
(ヘッダ画像の引用元:一般財団法人データサイエンティスト協会 2014年12月10日プレスリリース「データサイエンティストのミッション、スキルセット、定義、スキルレベルを発表」https://prtimes.jp/main/html/rd/p/000000005.000007312.html)
データソリューション部でデータプロダクトマネージャーとして働いている猪坂です。
当方は昨年の5月中旬にMICINにジョインしました。数ヶ月の経験ながらも今までと大きく違うことを感じており、ここではMICINのAI開発プロジェクトがどういうものか、他と何が違うのか紹介します。
当方の過去の経験
当方は2社でAI開発プロジェクトを経験してきました。
1社目ではデータサイエンティストとして企業向けAI開発プロジェクトを複数担当しました。設立されたばかりのAIベンチャーで会社としてのプロジェクト数は多くなかったです。
2社目ではプロジェクトマネージャーとして同じく企業向けAI開発プロジェクトを複数担当しました。こちらは上場しているAIベンチャーで多くのプロジェクトを手掛けている会社でした。
これら2社のAI開発プロジェクトは似ていましたが、MICINのAI開発プロジェクトの一部にはこれらと大きく異なるものがありました。
MICINのAI開発プロジェクト
ゼロからのプロダクト作り
MICINではビジョンに基づいて病気の識別・予測を主としたAIを開発しています。自社又は他社との共同プロダクトの開発を目指し、企業や医療機関と一緒に病気を識別・予測するAIを開発するものです。
病気の識別・予測に主眼を置いていることもあり、以下の特性を持つプロジェクトとなることがあります。
1. 何の病気をどのようなデータを使って識別・予測するかゼロベースで検討する
2. データを取得することから始めることも多い
実はこれらは自分が経験したAI開発とは大きく異なるものです。
自分が経験したAI開発では、既に蓄積されているデータを念頭に何を分析するか検討することが多かったです。つまりデータ取得システムは既にあり、使用可能なデータもほぼ決まっており、十分な量があります。これが一般的だと思います。
一方、MICINのAI開発では何のデータを取るべきかもゼロベースで検討することがあります。また、データをゼロから取得することも多いです。結果、データ取得システム自体も検討する必要性が出て、実質的にゼロからのプロダクト作りと言えるものになります。
病気の識別・予測のための調査
その場合、調査事項が増えます。具体的には下記のような調査を繰り返すことになります。
1. 予測対象の調査:ある病気がどのような機序で発生し、どのような症状を発生させ、どのような基準で鑑別診断されるのか、など
2. データの調査:その病気の識別・予測のためにはどのようなデータを取得することが必要か、そのデータの特性はどのようなものか、どのような場合であれば病気との関係性が担保されそうか、など
3. 測定機器の調査:そのデータはどのような原理で測定されているか、どのような測定条件であれば使えそうか、その測定条件は現実的か、など
4. 前処理及びアルゴリズムの調査:そのデータからその病気を識別・予測するにはどのような前処理及びアルゴリズムが必要か、実装にどの程度時間がかかりそうか、など
詳細は弊社のノウハウであるため記載していません。分析の失敗を防ぐために「など」の部分で調査すべきポイントがまだまだあります。
自分が経験したAI開発においても類似の調査は一定必要でしたが、データをゼロベースで検討・取得するAI開発プロジェクトでは上記の調査を何度も繰り返すことが違いです。何の病気をどのようなデータ・分析手法でなら現実的に識別・予測できそうか、目処がつくまで調査を続けることとなります。
今は上記の調査をどのようにすれば効率良くできるか、一定の型を作れないかなどを検討しているところです。
なぜそこまで調査するのか
一般のAI開発プロジェクトと同様にデータを決めてしまえば楽ではないかと思うかもしれません。ただ、その場合は病気を識別・予測できなくなるリスクが高まります。病気を識別・予測する観点からはデータを決めずに幅広く調査した方が良いです。
特定の論文をただ真似して簡単に調査を終えることも可能です、が、同様に病気を識別・予測できなくなるリスクが大きいです。分析手法が怪しかったりサンプル数が限定されていたりで、現実に適用できるか検討が必要な論文が多くあります。
そして現実への適用の検討のためには現実や手法の限界についてのより本質的な知識が必要です。上記の分野はそれぞれ専門家がおり日進月歩で新しい知識が生まれている分野ですが、しっかり調査して専門家に近いレベルの知識を獲得する必要性があります。
社会実装のための検討
更にその分析の社会実装を考えると下記のようなことの検討も必要です。
1. データ蓄積:どのようにデータを蓄積して、どのようにAIを発展させていくと良いか、それは現実的か
2. ユースケース:誰に対してどのようなアウトプットが必要で、それがどのように使われれば役立つのか、その使い方は現実的か
3. ビジネスモデル:これらの病気を識別・予測してどうすれば事業として成り立つのか
ただ分析できただけでは社会的なインパクトはありません。事業として成り立たせる必要性があり、このような観点での検討も必要になってきます。
よって顧客含む経営の知識も必要になりますし、アプリを開発する場合はソフトウェアの知識も必要になります。
これらの検討も自分が経験したAI開発で必要になりましたが、MICINの方が検討の自由度が高くより広範な検討が必要だと感じています。
総合格闘技としての医療AI
全般として、より広い知識・能力が必要となり総合格闘技的だと思います。
データサイエンティスト協会が提唱している「ビジネス力」、「データサイエンス力」、「データエンジニアリング」力の全てが広範囲で必要になるイメージです。
必要な知識・能力が広い分、効率が悪くなり失敗リスクも上がりがちです。
これは病気を識別・予測して不幸になる人を減らすプロダクトを作る上では仕方ないのだと感じています。
一方で、失敗リスクの高さは成功した時の参入障壁や競争優位にも繋がります。特に先んじてデータを蓄積できた場合は他社にない大きな強みになると考えられます。
また、医療に特化していることもあり、流用可能な知識を蓄積しやすく良いアイデアを検討しやすいです。ゼロからのプロダクト(そしてそれを活用した事業)作りを考えるには良い環境だと感じます。
全般的に、下記のような趣向を持つ、医療を良くするプロダクトを作りたい方であれば楽しめると思います。
・好奇心旺盛な人
・考えることが好きな人
・ゼロからのプロダクト(そしてそれを活用した事業)作りを目指す起業家マインドのある人
・病気について学びたい人
・何らかの病気の治療に貢献したい人
(もちろん!)募集してます
興味を持たれた方はぜひ弊社の募集をみてくれればと思います。
MICINのAI開発プロジェクトでは、ビジネスディベロップメント、データサイエンティスト、データプロダクトマネージャーの3つの職種が役割分担しつつ上記の知識・能力を充足しています。
役割を分担すると言えど、お互いの役割に踏み込んで意見を出す必要性は高く、そのためにも広い知識・能力が必要になります。
志向面で向いていそうな方は上記に記載した通りです。経験面では専門性を持ちつつも役割をはみ出して仕事をされてきた方が向いていると思います。
・正社員 * データサイエンティスト
・インターン * データサイエンティスト
データプロダクトマネージャーであれば以下の役割を担います。
1. ビジネス側から出てきたAI企画を彼らやデータサイエンティストと共に現実的な問題設定・計画に落とす(特に分析観点で)
2. 上記の計画に基づいてAI開発プロジェクトやAIプロダクトを管理する
技術にも事業にも知見がある方であれば活躍しやすいと思います。
・正社員 * データプロダクトマネージャー
・インターン * データプロダクトマネージャー
ご興味のある方はぜひご応募ください!