バイエル画像検査室

AI医療推進室

画像診断支援AIソフトウェアにおける感度と特異度

画像診断支援や読影支援のためのAIに関する資料を見ていたのですが、感度や特異度の意味合いを詳しく教えてくれませんか?

感度と特異度は、ある試験における診断能力を示す指標です。画像診断における感度と特異度について説明します。

近年、放射線科領域において多くの画像診断支援AIソフトウェアが開発されています。特に胸部領域においては画像診断全体の中で占める検査の割合が多く、そのため胸部領域の画像診断支援AIを導入することによって読影医への業務負担の軽減が期待できると考えられます。
今回は、画像診断支援AIの評価指標である感度と特異度および関連する他の指標について解説します。

評価指標:感度、特異度とは

感度と特異度とは、ある病気(疾患)に対する診断の能力を示す値として使われます。平たく表現すると、「感度」=「病気を見つける能力」、「特異度」=「病気でない症例を見つける能力」といえます。これらの指標の算出において、図1の様な2×2の表が用いられることがあります。

評価指標:感度、特異度とは

図1

ここで用いられている用語の定義は以下のようになります。

  • 真陽性=疾患がある場合で、陽性と診断されたもの(正解)
  • 偽陽性=疾患がない場合で、陽性と診断されたもの(不正解)
  • 偽陰性=疾患がある場合で、陰性と診断されたもの(不正解)
  • 真陰性=疾患がない場合で、陰性と診断されたもの(正解)

これらの結果をもとに、下記式にて感度と特異度が求められます。

  • 感度=真陽性/(真陽性+偽陰性)
  • 特異度=真陰性/(偽陽性+真陰性)

このように、感度は正解が”疾患あり”である場合に正しく”陽性と診断できた”確率、特異度は正解が”疾患なし”である場合に正しく”陰性と診断できた”確率となります。感度・特異度ともに0.0(0%)~1.0(100%)の値をとり、1.0に近づくほど良いとされています。

画像診断支援AIにおける感度と特異度

では感度と特異度を、画像診断支援AIに関連した具体例を用いて読み解いてみたいと思います。
胸部単純X線画像に対する、肺結節の同定を目的とした画像診断支援AIの予測結果例(図2)を基に考えてみると、

  • 真陽性=肺結節がある画像において、結節ありとAI予測されたもの(正解)
  • 偽陽性=肺結節がない画像において、結節ありとAI予測されたもの(不正解)
  • 偽陰性=肺結節がある画像において、結節なしとAI予測されたもの(不正解)
  • 真陰性=肺結節がない画像において、結節なしとAI予測されたもの(正解)
図2 肺結節の同定を目的とした画像診断支援AIの予測結果例

図2 肺結節の同定を目的とした画像診断支援AIの予測結果例

となり、感度と特異度を計算すると次のようになります。

  • 感度(%)=真陽性/(真陽性+偽陰性) x 100=63/(63+7) x 100=90
  • 特異度(%)=真陰性/(偽陽性+真陰性) x 100=56/(14+56) x 100=80

ただここで注意が必要となるのは、このAIソフトウェアが、疾患の有無だけを評価することが目的であるのか、その疾患の位置までも指摘することが目的なのかによって、感度や特異度の評価が変わります。

次回は画像診断AIソフトウェアの性能評価として、感度や特異度をどのように考えると良いのかを説明したいと思います。

感度と特異度の基本的な考え方はわかりました。これらの数値から製品の性能評価を行うとすればどのあたりに注意が必要なのか、次回教えてください。