AIは“ブラックボックス”とよく言われます。決定木自体は解釈しやすいのですが、木がたくさん集まって、森のようになっているランダムフォレストは必ずしも解釈しやすいものではありません。そのため、AIの説明性を高める「説明可能AI(Explainable AI:XAI)」に関する研究が進められています。
推定結果に対して各説明変数がどのように寄与しているのかを、XAIの一手法であるSHAP値で示したのが下図になります。
なお、土砂崩壊発生の有無のように推定したい値を「目的変数」、推定するためのベースとなる値を「説明変数」(この場合は、標高/傾斜角/土壌雨量指数/時間雨量)と呼びます。
横軸は右側にいくほど正の相関(一方が増加すれば他方も増加する傾向)が大きく、左側にいくほど負の相関(一方が増加した場合、他方は減少する傾向)が大きくなります。
点の色は、変数の値を表しており、赤色に近いと値が大きく、逆に青色に近いと値が小さくなっています。全ての変数に対して、おおむね右側の値が赤くなっていることから、値が大きくなるほど土砂災害発生のリスクが大きくなる正の相関があると分かります。ただし、標高については、左側にも値の大きな赤い部分がまとまっているため、標高が大きい場合には、土砂崩壊が起こりにくくなることもあると見てとれます。
アンサンブル学習の手法としては、「ブースティング」もよく用いられます。ブースティングの考え方は下図の通りで、1つ目の学習モデルの結果の誤差を反映し、2つ目の学習を行うことを繰り返して、次々に学習モデルを生成していくものです。
ブースティングによって、橋梁損傷の進展を予測した例が文献4※4です。劣化進展の推定では、栃木県が管理する橋梁の諸元や点検データと、気候や地形などの国土数値情報を利用しています。特に、この文献では、点検の画像データにニューラルネットワークを適用して画像内の特徴量を抽出し、それも説明変数に取り入れるという工夫を施しています。下図は、実際の進展とAIによる予測結果を地図上に表示したものです。
文献5の「インフラ維持管理業務での機械学習活用に向けたモデリング試行と結果の解釈に関する一考察」※5では、決定木やランダムフォレスト、ブースティングなどの手法について、同一の点検データで学習して比較することで、それぞれの長所や短所を整理しています.
このように、同じデータでいろいろな手法を用いて競争的に分析を行うことで、研究開発が進展し、手法の理解が進んで実用化にもつながることから、「Kaggle」などの機械学習のコンペティションも盛んです※6。
アンサンブル学習は、発展を続けており、コンペティションでも好成績を上げている手法の1つとなっています。点検データベースなどの整備と相まって、さらなる精度の向上や応用の拡大が期待されます。
★連載バックナンバー:『“土木×AI”で起きる建設現場のパラダイムシフト』
Copyright © ITmedia, Inc. All Rights Reserved.