【第19回】「ChatGPT」など大規模言語モデルの仕組みと土木領域での可能性“土木×AI”で起きる建設現場のパラダイムシフト(19)(2/2 ページ)

» 2023年06月20日 10時00分 公開
前のページへ 1|2       

ChatGPTで、スマートシティーとスマートモビリティの論文発表を分類

 大規模言語モデルは、膨大な文章のパターンを学習していると考えられますから、人間に近い受け答えが実現されることは自然に想像できます。しかし、それだけにとどまらず、論理的な推論や分類などでも、適切な結果を導き出すことが知られています。

 下図は、AIデータサイエンスシンポジウム※5での「スマートシティー」と「スマートモビリティ」のプログラムを対象に、ChatGPTに論文タイトルのみをそのまま投げて、それぞれのカテゴリーで分類してみた結果が右表です。ここでは、左表の実際に開催したときの人の手によるプログラム分けと、よく似た結果が得られています。

 黄色でハイライトした人流関係の論文をスマートモビリティに、オレンジの災害時の交通の論文をスマートシティーに分類しているところが違いますが、それでもプログラムとして成立しますので、適切に分類できていると言えましょう。このように、データの整理や分類などの作業の効率化にも役立ちます。

AI・データサイエンスシンポジウムの実際のプログラム(左)とChatGPTによる論文の分類(右) 出典:※5

※5 AI・データサイエンス特別シンポジウム「デジタルツイン」 プログラム/土木学会 構造工学委員会 AI・データサイエンス論文集編集小委員会/2023年3月23日

 ちなみに、スマートシティーとスマートモビリティの違いを100文字程度にまとめるように、ChatGPTに問いかけたところ、「スマートシティーは都市全体の持続可能性を向上させるための総合的なアプローチであり、サービスやインフラの統合的な管理を目指す。スマートモビリティは交通システムと移動手段に焦点を当て、効率性や持続可能性を向上させる。」との回答でした。

Transformerをインフラ画像点検などにも適用できる「Vision Transformer」

 Transformerは、言語のみならず画像にも適用可能です。その手法である「Vision Transformer」では、下図のように、画像をパッチに分け、そのパッチを一連のデータとして扱っています。大規模な一般画像データセットで事前学習した後に、専門分野でのデータを用いて追加的な学習を行うことでモデルを微調整する「ファインチューニング(fine tuning)」によって、さまざまな専門分野でも高い精度が得られます。インフラ点検の損傷画像などデータ数が限られる場合にも有望なアプローチであると考えられます。なお、大規模言語モデルでも、専門分野の文章を追加してファインチューニングすることができます。

Vision Transformerの概要 出典:※6

 下図は、点検画像と、その画像に対応するアテンションを表示したアテンションマップの例です。剥落(はくらく)やひび割れなど、損傷に関連する領域が強調されるようにアテンションが高くなっています。

点検画像とアテンションマップ 出典:※6

※6 「地下鉄トンネル点検時の一人称視点映像を用いたVision Transformerに基づく変状検出」櫻井慶悟,前田圭介,藤後廉,小川貴弘,長谷山美紀/AI・データサイエンス論文集3巻J2号p470-478/「科学技術情報発信・流通総合システム(J-STAGE)」/2022年

 このように、大規模言語モデルのベースとなるTransformerは、言語のみならず、画像などの多様なデータに適用できるのです。言語、画像、センサーデータなどを組み合わせたマルチモーダルなデータへの拡張も可能です。実務でも、点検調書のように、画像と言語からなるマルチモーダルなデータを用いる場面も多いため、大規模言語モデルの発展とともに、これから本格的に応用が広がっていくことが期待されます。

著者Profile

阿部 雅人/Masato Abe

ベイシスコンサルティング 研究開発室 チーフリサーチャー。防災科学技術研究所 客員研究員。土木学会 構造工学委員会 構造工学でのAI活用に関する研究小委員会 副委員長を務めた後、現在はAI・データサイエンス実践研究小委員会 副委員長。インフラメンテナンス国民会議 実行委員も兼任。

近著に、「構造物のモニタリング技術」(日本鋼構造協会編/コロナ社)がある。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.