PublicationsAI論文(胃)内視鏡AIによる胃の萎縮診断2023/10/26

筆頭著者|小髙 康裕
所属施設|日本医科大学
ジャーナル名|JGH Open

今回は、胃粘膜の萎縮についてAIで判定し、その精度について評価した論文を取り上げます。Kodaka Y, Futagami S, Watanabe YらがJGH open誌に2022年に報告した” Determination of gastric atrophy with artificial intelligence compared to the assessments of the modified Kyoto and OLGA classifications”です。

内視鏡医が胃癌の前癌病変と考えられる腸上皮化生や胃の萎縮を検出し、その病変を評価することは重要ですが、その精度は内視鏡施行医に大きく依存します。そこで、本論文内ではAIを用いて内視鏡画像から胃の萎縮診断をすることが可能かどうかを評価しています。

評価の方法ですが、内視鏡専門医の判定した木村・竹本分類およびmodified京都分類、Ruggeらが報告したOLGA分類(前庭部と体部から生検を行い、その萎縮の程度と範囲を評価)、胃癌と関連があると報告されている遺伝子型(COX-21195、IL-1β511、mPGES-1)と、AIが内視鏡画像から萎縮があるか判定した症例とで、その相関を判定しています。

AIが萎縮ありと判定した症例と、木村・竹本分類およびmodified京都分類、OLGA分類とは相関がみられましたが、COX-2、IL-1β、mPGES-1とは相関はみられませんでした。AUCは、AI単独(0.665)よりもOLGA分類+AI(0.675)、modified京都分類+AI(0.746)の方が高い結果となりました。

以上より、KodakaらはAI+modified京都分類、AI+OLGA分類は胃の萎縮を評価することで胃癌の発生を予測する有用なツールとなる可能性があると結論付けています。

ここからさらに論文の内容について詳しくみていきましょう。

まず、トレーニングデータセットですが、11497枚の白色光画像(萎縮あり4373枚、萎縮なし7124枚)を用いています(4294枚の胃体部の見下ろし画像、4003枚の胃体部反転観察画像、3200枚の前庭部画像)。

テストデータセットですが、270名のH.pylori陽性患者(除菌治療前)の内視鏡画像7724枚を用いています。AIの判定ですが、見下ろしも反転も萎縮ありと判定した場合は”severe atrophy”、見下ろしは萎縮なし・反転で萎縮ありと判定した場合は”moderate atrophy”、見下ろしも反転も萎縮なしと判定した場合は”mild atrophy”としています。そして、”none to mild”と”moderate to severe”の2群にわけて他の指標と比較しています。

木村・竹本分類は (C-Ⅰ, C-Ⅱ) vs. (C-Ⅲ, O-Ⅰ, O-Ⅱ, O-Ⅲ)と2群に分けて比較しています。京都分類についてですが、RACの有無と胃体部大弯のatrophic foldの有無で比較しています。OLGA分類ですが、病理学的に評価が可能であった135名のデータを用いて判定しています(萎縮のないStage0から高度の萎縮をみとめるStageⅣの5段階で評価します)。

Stage0が12名、StageⅠが52名、StageⅡが37名、StageⅢが23名、StageⅣが11名でした。Stage0,ⅠとStageⅡ,Ⅲ,Ⅳの2群にわけて比較しています。

COX-21195、IL-1β511、mPGES-1の3つの遺伝子型については、末梢血の白血球あるいは胃の生検検体から市販のキットを用いて判定を行っています。

結果です。

木村・竹本分類との比較ですが、AIは54例中31例でC-1, C-2と判定、216例中151例でC-Ⅲ, O-Ⅰ, O-Ⅱ, O-Ⅲと判定しました。(精度は67.4%)

京都分類との比較ですが、AIは24例中20例でatrophic foldがあると判定(感度 83.3%)しましたが、atrophic foldについては246例中92例で判定が一致しました(特異度37.4%)。

RACでの判定ですが、AIは20例中15例でRAC(+)と判定が一致し(感度 75.0%)、RAC(-)については250例中169例で判定が一致しました(特異度67.6%)。RACでの判定において、精度は68.1%でした。

OLGA分類ですが、AIはStage0,Ⅰであった64例中34例で”none to mild”と判定し、StageⅡ,Ⅲ,Ⅳについては71例中50例で”moderate to severe”と判定しました。精度は62.2%でした。

COX-21195、IL-1β511、mPGES-1の3つの遺伝子型については、AIとの関連性はみとめられませんでした(P=0.796, 0.850, 0.759)

考察では、後ろ向き単施設での研究であることや、トレーニングセットとテストセットで内視鏡スコープの種類が違うこと(テストセットでは、複数の種類のスコープで撮影した画像が混在)、ピロリ除菌後の胃内視鏡画像について評価ができていない点などlimitationはあるものの、AI+modified京都分類、AI+OLGA分類は胃癌の発生を予測する有用なツールとなる可能性があると述べています。

Websiteでは、Supporting informationとして、どのような画像を萎縮ありと判定していたか実際の内視鏡画像を確認することができます。ご興味いただけた方は是非、websiteで論文もご覧ください。

https://onlinelibrary.wiley.com/doi/full/10.1002/jgh3.12810