メディア

土砂崩落やインフラ点検などで最適化するためにAI性能を評価するには？【土木×AI第13回】：“土木×AI”で起きる建設現場のパラダイムシフト（13）（1/2 ページ）

連載第13回は、AIで得られた結果のなかで、未検出や誤検出を減らすために必要なAIの評価手法について論じます。

» 2022年07月11日 10時00分公開

[阿部雅人（土木学会 AI・データサイエンス実践研究小委員会副委員長），BUILT]

　これまでの連載で紹介してきたように、最近ではさまざまなAI手法が提案されていますが、応用や対象によって適した方法が異なる場合があります。そうした際に、自分で作ってみたAIが、どの程度の性能なのかを確かめたり、他のAIと比べてみたりしたいこともあるでしょう。では、AIから得られた結果を比較し、評価するにはどのようにすればよいのでしょうか？

AIを評価するのに一般的な「混同行列」

　下図は、AIにより航空写真をもとに、土砂崩壊箇所を検出した結果です※1,2。おおむね正確に検出できていますが、細かく見ると、崩壊を検出できていない箇所（未検出）や崩壊していない健全なところを誤って検出してしまっている箇所（誤検出）が見受けられます。

AIによる土砂崩壊箇所の予測と誤検出／未検出の例　出典：※2

※1 「Semantic Segmentationを用いた斜面崩壊領域の自動検出」叶井和樹,山根達郎,石黒聡士,全邦釘／AI・データサイエンス論文集1巻J1号p421-428／「科学技術情報発信・流通総合システム（J-STAGE）」／2020年

※2 「Mask R-CNNによる航空写真からの土砂崩壊地自動検出手法」叶井和樹,久保栞,山根達郎,全邦釘／AI・データサイエンス論文集1巻J1号p223-231／「科学技術情報発信・流通総合システム（J-STAGE）」／2021年

★連載バックナンバー：

『“土木×AI”で起きる建設現場のパラダイムシフト』

本連載では、土木学会 AI・データサイエンス実践研究小委員会副委員長を務める阿部雅人氏が、AIと土木の最新研究をもとに、今後の課題や将来像について考えていきます。

　AIの検出結果に、未検出な部分があると、危険な箇所を見落とす可能性があります。また、誤検出の際には、本来は安全なところを危険と誤って認識し、必要がない現場確認や余計な対応をしてしまうかもしれません。そのため、単に全体的な正解率を向上させるだけではなく、未検出や誤検出を減らしていくことも望まれます。

　未検出や誤検出を含めて、AIを評価するのに一般的に用いられるのが下図の「混同行列」です※3。実際の分類とAIによる予測結果が合っていれば「真（true）」、異なっていれば「偽（false）」として、表の各項目に該当するサンプル数を整理する手法です。

　新型コロナウイルスの検査で、「偽陽性」などの用語が報道などで採り上げられていたことを記憶されている方も多いかと思います。この表では、偽陰性FNが未検出、偽陽性FPが誤検出にあたります。