東急不動産ホールディングスは、多様な形式の文書から必要な情報を自動抽出するAI技術「文書情報抽出システム及びプログラム」を開発し、特許を出願した。
東急不動産ホールディングスと東急不動産は2025年10月8日、社内業務の効率化を目的に、見積書や請求書、契約書といった多様な形式の文書から必要な情報を自動抽出するAI技術「文書情報抽出システム及びプログラム」を開発し、特許を出願したと発表した。
新技術は、従来のOCRが抱えていた文書フォーマットの違いに関する課題を解決するもの。テンプレートや専用の設定を行わなくても、AIが帳票の文書構造を解析し、データベース項目に応じた情報を抽出/データ化する。データベースの項目構造を動的に分析し、文書内容との意味的関連性を自動で判断する仕組みを備えている。異なる帳票形式や新規取引先のフォーマットにも柔軟に対応できる。
さらに、抽出結果に対して利用者が行う修正やフィードバックから、AIが業務ルールや判断パターンを継続的に学習し、進化させる。
両社はこれまでに、TFHD Chatとクラウドストレージ「BOX」を連携させる独自技術について特許を出願済。この技術は、AIモデルの柔軟な選択/更新機能と、ファイルを分割/検索するインデックス化技術を組み合わせている。MicrosoftのAzure AI Searchを活用し、PDFやPowerPointなどのデータを高精度に検索。文書内の該当箇所を特定し、その情報を基に生成AIが回答を作成する仕組みだ。誤情報生成(ハルシネーション)を抑制し、情報の出典を明示することで信頼性を高めている。
Copyright © ITmedia, Inc. All Rights Reserved.
人気記事トップ10