連載第15回は、Web上で話題となっているAIで画像を自動生成する技術について、インフラ分野でどのように生かせるか、先端技術の論文を紐(ひも)解きながら紹介します。
AIで画像やイラストを自動生成するサービスが、ここのところWeb上で話題になっています。最近公開された「Stable Diffusion」※1というAIでは、テキストで、ある特定のキーワードを指定すると、それに応じた質の高い画像が自動生成されます。こうしたAIの画像生成技術は、インフラ分野では、どのように活用できるでしょうか?
インフラの問題のなかで特に、損傷や異常を検知するような問題では、データ自体が少ないのが一般的です。そこで、下図の「敵対的生成ネットワーク(Generative adversarial networks:GAN)」と呼ばれる方法によって、画像データを拡張する試みが行われています。
GANは、「生成器(Generator)」と「識別器(Discriminator)」という2つのニューラルネットワークで構成されています。生成器はノイズを入力として贋物のデータを生成し、一方で識別器は、生成器が生成した「贋作データ」と「本物の教師データ」を入力して、本物かどうかを判別します。
このように生成器が「贋物」を作り、識別器が「本物」を見分けることを互いに競い合うことで、生成器が教師データに近いデータを生成できるようにする仕組みとなっています。
※1 Stable Diffusion入門:誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方/@IT
★連載バックナンバー:
本連載では、土木学会 AI・データサイエンス実践研究小委員会 副委員長を務める阿部雅人氏が、AIと土木の最新研究をもとに、今後の課題や将来像について考えていきます。
文献2の「敵対的生成ネットワークを用いた耐候性鋼材のさび画像生成に関する基礎的研究」※2では、耐候性鋼材のさび画像データの拡張を行っています。耐候性鋼材とは、表面に緻密な保護性さびを生成することにより、防食性能を発揮する鋼材で、橋などに用いられることがあります。
耐候性鋼材の一般的な点検方法は、目視による外観評価で、評点2が要観察、評点1が異常として判断されています。特に、評点の低い画像は枚数が少なく、機械学習適用上の課題となっており、また、異常と正常の境界である評点3や評点4、5についても精度の高い判断を実現するには多くの画像が必要です。
下図は、評点3であるデータセット画像と生成した画像の例です。専門家が生成画像を判定したところ、ほとんどの画像でデータセット画像と同じ評点が得られるなど、良好な結果が得られています。
Copyright © ITmedia, Inc. All Rights Reserved.