メディア

ChatGPTの新機能「GPT-4V」など、言語と画像のマルチモーダルAIを土木に用いるアイデア【土木×AI第22回】：“土木×AI”で起きる建設現場のパラダイムシフト（22）（2/2 ページ）

» 2024年01月12日 10時00分公開

[阿部雅人（土木学会 AI・データサイエンス実践研究小委員会副委員長），BUILT]

専門的な問題に対応させる「フューショット学習」

　事前に膨大な数の画像と言語のペアについて学習しておくことで、CLIPに学習していない画像を入力した場合であっても、画像と言語の関係性を表現可能であることが分かりました。このように未知の画像に対し、学習済みモデルを適用することを「ゼロショット（zero-shot）学習」と言います。さらに、CLIPと大規模マルチモーダルモデルを組み合わせることで、画像をCLIPに入力して得られる結果から説明文を生成する方法も提案されています。

　点検時の変状画像から所見の生成を試みたのが文献3です。下図に示すように、まず、CLIPに対象の変状画像を入力することで、類似した変状画像を持つ過去の点検記録を取得します。次に、過去の点検記録を数件用い、大規模マルチモーダルモデルに入力しています。極少数の事例を与えることで、専門的な問題に対する適用性を高めることは、「フューショット（few-shot）学習」と呼ばれており、この場合は、類似似損傷事例でフューショット学習をすることで、所見の精度を高める効果を狙った仕組みになっています※3。

変状画像Iと類似した過去の点検記録M件にフューショット学習を適用し、所見Sを生成　出典：※3

※3 「Visual language modelを用いた変状画像に対する所見の自動生成ー類似画像検索によるFew-shot learningの導入ー」渡邉優宇人,小川直輝,前田圭介,小川貴弘,長谷山美紀／AI・データサイエンス論文集4巻3号p223-232／「科学技術情報発信・流通総合システム（J-STAGE）」／2023年

　この方法で、画像から損傷の性状や進展予測などの所見を生成した結果が下図です。完全に技術者の所見を再現しているわけではありませんが、赤字で示した記述を見るとポイントとしては対応できています。

技術者と提案手法による所見の比較　出典：※3

　エンベディングを用いることで、テキストを分類するなどの他のタスクを行うこともできます。文献4では、膨大な事前学習が行われている「GPT（Generative Pre-trained Transformer：生成事前学習トランスフォーマ）」を利用しています※4。

※4 「土木・建設分野における大規模言語モデルの利活用に向けた検証と考察」菅田大輔,箱石健太,一言正之／AI・データサイエンス論文集4巻3号p670-676／「科学技術情報発信・流通総合システム（J-STAGE）」／2023年

　下図は、GPTを用いて、国土交通省の「NETIS（新技術情報提供システム）」掲載の技術をエンベディングし、次元を圧縮して2次元マップ上に表示したものです。図中で、「工法」と「材料」は、いずれも施工に用いられますから、入り乱れて表示されています。しかし、「システム」や「機械」は単体として分かれています。「製品」は他と離れている独自のものもありますが、施工に用いられるケースもあるので、一部は「工法」と重なっています。

新技術情報の分類と類似性　出典：※4

　言語と画像のマルチモーダルなAIによって、実業務に近い作業のデジタルトランスフォーメーションが視野に入りつつあります。さらに、AIに土木の専門知を取り入れることで、具体的な技術課題への適用の拡大も期待されています。

著者Profile

阿部雅人／Masato Abe

ベイシスコンサルティング研究開発室チーフリサーチャー。防災科学技術研究所客員研究員。土木学会構造工学委員会構造工学でのAI活用に関する研究小委員会副委員長を務めた後、現在はAI・データサイエンス実践研究小委員会副委員長。インフラメンテナンス国民会議実行委員も兼任。

近著に「構造物のモニタリング技術」（編：日本鋼構造協会／コロナ社）。

★連載バックナンバー：

『“土木×AI”で起きる建設現場のパラダイムシフト』

　■【第21回】AIと車両搭載IoTセンサーで、交通インフラの問題を解消する最新研究

　■【第20回】土木工学の新たな扉を開ける“デジタルツイン”　最新研究にみる「ミラーワールド」の可能性

　■【第19回】「ChatGPT」など大規模言語モデルの仕組みと土木領域での可能性

Archi Future 2023：「AI×建築設計」新時代の幕開け　ChatGPTとBIMの連結で未曽有の設計プロセス革新
2023年はAIへの注目が社会全体で集まり、特にChatGPTをはじめとする自然言語処理は、AIを身近なものにした。自然言語処理は、人が日常生活で使う言葉をAIが処理する技術で、話し言葉でAIに指示できる。フローワークス代表横関浩氏は、AIで設計者の業務がどのように変わるかを探求し、建築写真をもとにChatGPTで自動3Dモデリングなどを試みている。
デジタルツイン：日立が原発をWebベースのメタバース空間に再現　生成AIで設備や点検の情報を抽出
日立製作所は、インフラ維持管理の現場データをデジタルツインで収集し、情報共有や合意形成を効率化するWebベースの「現場拡張メタバース」を開発した。設備や点検などの日々蓄積されていく情報は、生成AIで施主も含め関係者が必要なデータに容易にアクセスできる。
現場管理：教育型建設業マッチングサービス「現場のヒーロー」が「WORK DESIGN AWARD」受賞
野田配管工業が提供する教育型建設業マッチングサービス「現場のヒーロー」が、SmartHRの「WORK DESIGN AWARD」PRODUCT部門を受賞した。
ドローン：Starlinkとポート付きドローンで目視外自律飛行、現場監理の時間を8割短縮　大林組とKDDI
大林組とKDDIスマートドローンは、目視外で自律飛行し、建設現場やインフラの巡視、点検、計測、異常検知を自動で行うドローンシステムを開発した。実証では、現場監理業務の時間を80％削減し、官民研究開発投資拡大プログラムでA評価を獲得した。
電子ブックレット（BUILT）：土木学会の最新論文にみるAI最新研究　 “土木×AI”で起きる建設現場のパラダイムシフトVol.2
ウェブサイトに掲載した記事を印刷しても読みやすいPDF形式の「電子ブックレット」にまとめました。無料のBUILT読者会員に登録することで、ダウンロードすることができます。今回のブックレットは、これまでにBUILTで連載した土木学会による「土木工学×AI」の先端研究をまとめた第2弾です。