日本医療研究開発機構 臨床研究等ICT基盤構築研究事業の研究成果報告について

日本医療研究開発機構 臨床研究等ICT基盤構築研究事業
研究成果報告

研究開発実施期間:2017年1月27日~2018年3月31日
研究開発代表者:一般社団法人 日本消化器内視鏡学会
理事長 田尻 久雄
理事長特別補佐 田中 聖人

研究開発の背景

消化器内視鏡機器のシェアは世界の70%を日本製品が占めており、学術的な研究、技術の先進性はわが国が世界をリードする立場にある。 日本国内の年間の消化器内視鏡診療件数は約1300万件であり、全国医療機関に蓄積されている画像と診療データの質と量は世界的に類を見ない。 しかしながら、臨床研究の基礎となる膨大な画像と診断データを統合集積するデータベースが存在せず、 また、年々増加する内視鏡診療件数に比して、内視鏡医や特に専門医・指導医は圧倒的に不足しており、 内視鏡診療の質と安全性確保において切迫した問題となっている。
 一方、人工知能システムにおいても、わが国が深層学習を中心とする高度なモデルと学習アルリズムの研究レベルにおいて世界最高水準にある。 本研究の内視鏡診療画像と診断データの融合による統合型データべースと、AI画像解析技術を活用して、 医療画像ビッグデータをAI画像解析技術を活用し解析するための高性能クラウド基盤が情報連結されることにより、 共に世界最高水準にある内視鏡診療分野と情報研究分野の初めての共同研究基盤が実現する。
 本研究によりAIによる内視鏡診療の自動診断が実現されれば、自動診断ロジックを内視鏡機器に付加することで、リアルタイムでの内視鏡自動診断が可能になり、 検診段階における疾患発見数の著しい上昇と、早期がんの自動診断の期待がなされ、国民に対する利益は大変に大きなものになると考えられる。

1.目的

本研究は、国内の消化器内視鏡診療画像と診断情報を統合管理するデータベースの構築し、集積された大規模データをもとに、AI(深層学習)による自動診断の実用性評価を行う。

2.構築システム概要

 本研究は臨床側の疾患群毎の診療データ及び画像収集を日本消化器内視鏡学会が担当し、AIによる深層 学習に基づく半教師学習を情報・システム研究機構の国立情報学研究所、東京大学、九州大学、名古屋大 学が研究を分担した。
 画像提供施設は全国内視鏡指導施設1,400施設から、支部を含むハイボリューム施設62施設を選定し、 各施設には、院内の部門システムから画像と診断データを受取り、個人情報秘匿化後にデータ送信または ハードディスク出力を行うアップローダを開発・設置した。アップローダは今後無償で配布し、これによ り施設内の膨大な内視鏡診療データを二重入力なしに精確に悉皆性を持って収集可能となった。

構築したシステム概要を以下に示す。

3.研究開発の実施体制

4.研究開発の概要

1)画像+診断データの収集と画像統合データベースの基盤整備の状況

 対象データは内視鏡画像が主体であるが、消化器内視鏡診療で扱う疾患群は非常に多岐に亘るため、画 像単体での活用は非常に難しく、臓器、部位、診断情報の正解データの裏付けがあって、初めて深層学習 に基づく半教師学習が可能となる。
 また、基盤システム整備には数ヶ月の期間を要し、基盤完成後に画像収集を行うと画像提供が後半や年度 末に集中する事となりAI研究開始が著しく遅延するリスクがある。
 以上の点を考慮し、基盤設計にあたってはAI画像診断研究を推進するために以下の方針を立てた。

 対象データは内視鏡画像が主体であるが、消化器内視鏡診療で扱う疾患群は非常に多岐に亘るため、画 像単体での活用は非常に難しく、臓器、部位、診断情報の正解データの裏付けがあって、初めて深層学習 に基づく半教師学習が可能となる。
 また、基盤システム整備には数ヶ月の期間を要し、基盤完成後に画像収集を行うと画像提供が後半や年度 末に集中する事となりAI研究開始が著しく遅延するリスクがある。
 以上の点を考慮し、基盤設計にあたってはAI画像診断研究を推進するために以下の方針を立てた。

  • ①対象データは上部内視鏡画像に限定する。
  • ②可能な限り早期に評価用画像データをAI研究分担者に渡し、研究に必要な要件抽出を優先する。
    また、基盤整備中でもAI研究の進捗に応じた抽出要件に応じた画像提供を行う。
  • ③AI研究の要件・要求に耐えうるよう、画像と画像が表す部位や特徴を形成する病態を中心とする臓器、 部位、診断情報の統合データベースとする。

 研究開始当初に行われたNII、東京大学、九州大学、名古屋大学との打ち合わせにより、画像上の個人情 報マスキング処理が試験段階となった時点で、京都第二赤十字病院を先行サイトとし第1期としてAI研究 評価用データ約600症例,約30,000画像、その後部位のAI学習用として67例、3700枚をAI研究チーム へ渡すことができた。
 以下、現在までの画像+診断データの収集状況とAI研究用画像提供実績を記す。

  • 第1期(2017.3) AI研究評価用画像データ 約600症例分30,000画像(胃がんのみ)提供
  • 第2期(2017.3) 部位判別研究用、部位別分類画像データ67分類3,700画像の提供
  • 第3期(2017.6)約19,000症例950,000画像中、約880,000画像の提供
  • 第4期(2017.12)手作業による病変マーキング付き画像約1,000画像の提供 AIによる部位分類画像を医師の正解判定後の再分類した約70,000画像の提供
  • 第5期(2018.1)多様性のある画像の画像約 4,800症例分の25,000画像の提供
  • 第6期(2018.2)約109,000症例346,000画像の追加収集・集積(統合サーバへの集積のみ)

画像収集・集積については、計画当初約15,000症例900,000画像の収集・集積を目標としたが、計画を 大きく上回り、現在まで約133,400症例1,649,700画像、3月末までに250,000症例2,000,000画像の収 集・集積が見込まれている。

第1期以降、学会とAI研究分担者チームで自動診断技術を飛躍的に進展させる目的で研究定例会を開催 し、医工連携による課題検討を行った。特に重要なテーマはAIによる画像の部位判定と病変の検出であり、 部位に関しては、AIによる部位の自動認識結果から熟練医師がその正誤解析を行った結果、解剖学的部位 と撮影画像としての特徴を持つ部位分類に差があることが認識がされ、見上げ上部、見上げ体部、見下ろ し体部ごとのグルーピングによる深層学習や、部位認識で特徴的な胃角部を追加することにより識別精度 を著しく向上させることが可能であるという結果が得られた。

 一方で、病変検出については病変範囲の特定学習のため画像に四角枠で病変を囲む手法で教材を用意し、 病変有無検出は高い検出率となったが、より精確な病変範囲の検出精度を上げるためにはより自由曲線に よる精確なマーキングを行なった大量画像が必要であり、そのためには、判定する熟練医師が効率良く マーキングとタグ付けが可能な画像編集ツールの開発が必要であるという課題も見えた。

 このような内視鏡専門医とAI研究チームによる共同研究方式は、医療現場で使う前提での画題抽出と医療、 AI技術両面からの具体的な課題解決検討がなされ、良い成果が得られている。

2) AI(深層学習)による自動診断の実用性評価の状況

 AI研究の基盤となる高性能ストレージおよびGPUサーバ等から構成される高性能クラウド基盤を構築 した。本クラウド基盤上で大量の内視鏡画像データを用いAI(深層学習)による内視鏡領域の自動診断 の要素技術となる以下の技術開発を行った。

① AI(深層学習)による診断結果の予測アルゴリズムの開発

 内視鏡医にアノテーションとして胃がんなどの疾患箇所に矩形領域を付与してもらい、得られた正常 画像と比較して少量のアノテーション付きの疾患画像と疾患箇所を含まない大量の正常画像を入力とし たAIによる疾患箇所の予測アルゴリズムを開発した。

② 内視鏡画像中の部位及び悪性腫瘍部位の検出技術の開発

  • 内視鏡画像をクラスタリングするAI画像解析技術
     臓器内、特に胃内部での画像の見え方が、胃の部位(穹窿部,体上部,体下部胃角部など)に よって大きく左右されることに着目した、内視鏡画像のクラスタリングを実現した。
  • 異常検出の枠組みによる腫瘍検出技術
     腫瘍は、ある意味異常、すなわち正常状態からの逸脱である。この逸脱を見つけるためには、事前 に正常画像がどのような分布であるかを求めておき、その後の入力画像が正常画像の分布内なのか分 布外なのかを評価する。比較的小規模での評価実験の結果、感度は60%程度であり、本方式には改良 の余地が多くあることが分かった。
  • テクスチャ認識に特化したCNNの新規構築
     内視鏡画像は部位によって見え方が大きく異なり、それらは主にテクスチャの違いとして現れる。 そこで部位認識に寄与しうるものとして、テクスチャ認識法の開発を実施した。

③胃内視鏡画像を撮影位置に応じて臓器分類する画像処理技術の開発

 内視鏡画像の臓器分類技術の開発では、胃内視鏡画像を撮影位置に応じて分類する技術を実現した。
ここでは、入力胃内視鏡画像を、(1)粗位置分類、(2)精密位置分類の2段階で位置分類する技術を実現した。

3) 日本消化器内視鏡学会、日本病理学会、日本放射線学会、3学会のデータベース連携における技術的課題抽出と、倫理的課題抽出の状況

 追加研究として、3学会のデータベース連携における技術的課題抽出と倫理的課題抽出を実施した。
 3学会のデータベース連携については、病理システムベンダー11社の調査と、放射線学会開発のゲート ウェイ機能を調査し、院内レベルと学会レベルの連携を同一スキームで実現可能なデータマッチングシ ステムを検討し、評価システムを開発した。
 実証試験サイトとして、3学会データ連携をすでに実現して院内活用を行っている先進医療機関である 京都第二赤十字病院をモデルに実証し、既存システムとマッチングシステムによる運用、使用比較によ り課題を抽出した。また、今後のAI活用と病理連携がもっとも期待される内視鏡検診領域をモデルと し、実際に青森県のプロジェクトである大腸内視鏡検診で実証試験を実施し、今後の検診領域での活用 をする上での実践的な課題抽出を実施した。
 本研究により、画像診断領域においては部位・病変単位の病理診断付き画像の提供が可能となり、AI 深層学習による画像診断研究が加速され、今後の検診領域での病変の発見や診断の研究領域が飛躍的に 拡大することが期待される。
 倫理的課題抽出では、本事業を進めていく中で参加施設から倫理委員会承認が得られずに苦慮する ケースが多く、次世代医療基盤法の施行に向けて個人情報保護法や倫理指針の観点から、診療データと 画像を収集・集積するための患者同意の取り方や倫理委員会の承認を得るための申請ポイントなどの検討 を行い現状の課題抽出を実施した。

以上

お問い合わせ

ご不明な点がございましたらお気軽にお問い合わせください。