SBテクノロジーとJR西日本は、鉄道工事に関するデータの有効活用に向けて、RAG技術を用いた生成AIの実証実験を行った。実証の結果、生成AIによる回答精度について一定の有用性を確認した。
SBテクノロジーは2024年12月19日、JR西日本が保有する鉄道工事に関する6万件のドキュメントを対象に、RAG(検索拡張生成)技術を用いた生成AIの実証実験を行ったと発表した。実証の結果、生成AIによる回答精度について一定の有用性を確認した。
JR西日本で鉄道建設プロジェクトを担う大阪工事事務所では、ナレッジの引き継ぎや組織の若年層化を見据え、鉄道や技術ノウハウに関する建設データを、クラウドストレージサービスで共有している。しかし、膨大な資料から過去の工事事例や安全/品質に関するルールの情報を検索する手間が負担となり、熟練技術者の経験や知見に頼らざるを得ない状況にあるという。
そこで今回、SBテクノロジーの生成AIに関する専門知識を生かし、RAGを用いた情報検索システムを構築した。過去の技術ノウハウが蓄積されたデータを有効活用することで、若手技術者のスキル向上を目指す。
検証システムは、Microsoft Azureのクラウド基盤に約1カ月で構築。セキュリティ面では、Azure Virtual Networkによるプライベートアクセスの構成に加え、生成AIへの連携前に個人情報を自動で削除する機能も備えた。クラウドストレージに保管した約6万件のファイルに対するセキュアな生成AI活用基盤を整備している。プロンプト(指示文)を入力することで、データの中から関連性のある情報を基に回答文を生成。各種パラメーターにより回答傾向の調整も可能だ。
今回検証したデータの中には、業務規程、過去の事故情報や施工計画書などの鉄道建設工事に関連する多様なドキュメントが含まれている。作成者によって、レールと線路、コンクリートとRCなど表記のばらつき(ゆれ)も見られた。これらの表記ゆれを吸収/加味した上で情報検索の精度を上げるため、RAGを用いた検証を実施。検索時の利便性向上のために、生成された回答の引用元となる関連ドキュメントリンクの提示や、ファイル内容を端的に理解する「機械設備」「安全確保」などの文書タグの自動生成機能を実装した。
これら一連の取り組みについて、施工計画書や業務参考資料、契約書類などのドキュメントに対し、適切な分類や分類に応じた回答の生成内容など、利便性を含めて検証のベンチマークとした項目を総合的に検証。一定の有用性を確認した。
Copyright © ITmedia, Inc. All Rights Reserved.