LLMは、文章の要約やテキストデータの変換に適しています。そのため、各種データを保管/管理する“データリポジトリ”への利活用も考えられています※3。下表でいうメタデータとは、データを説明するデータのことで、キーワードや特徴などをメタデータとしておくことで検索しやすくするためのものです。
例えば図書館のデータベースで図書を探すときに使う、書名、著者名、出版年なども一種のメタデータです。メタデータがあることでデータが使いやすくなるのですが、データが大きくなるとメタデータの作成の負担が増えてしまいます。そこをLLMで効率化できるわけです。
※3 地球環境データ統合・解析プラットフォーム事業(DIAS) 国立情報学研究所(NII)チーム「データリポジトリとLLM勉強会」
収集した調査票などの分析にもAIが利用されています。文献4では、豪雨災害時における住民避難行動のアンケート調査データを画像データへ変換し、AIを用いて分析しています。また、文献5では、誤入力などの検出へのLLMの適用性が検討されています。
文字や文書などの読み取りには、「OCR(光学文字認識:Optical character recognition)」技術を用いることもできます。アンケート以外にも、ナンバープレート※6や点検調書※7の読み取りにも使われています。下図は、点検調書からのAIを用いたOCRによる文字の読み取り例です。
Copyright © ITmedia, Inc. All Rights Reserved.