AI技術Mistral AI2026年6月25日 20:24

Mistral、文書解析AI「OCR 4」を公開

フランスのAI企業Mistral AIは、文書構造の解析に対応した新世代OCRモデル「OCR 4」を発表した。テキスト抽出にとどまらず、各要素の位置情報・種別分類・確信度スコアを一括出力できる設計で、自社インフラへの単体導入にも対応している。料金は1,000ページあたり4ドル(バッチ利用時は2ドル)で、Mistral APIやAmazon SageMaker、Microsoft Foundryなど複数のプラットフォームから即日利用可能だ。

フランスのAI企業Mistral AIは、文書から情報を読み取る新モデル「OCR 4」を発表した。OCR(光学文字認識)とは、紙や画像の文字をコンピューターが扱えるデータに変換する技術のことで、今回のOCR 4はその枠を大きく超えた仕組みを備えている。単に文字を取り出すだけでなく、文書全体の構造を解析し、各要素の位置・種類・信頼度まで一括して出力できる点が従来モデルとの大きな違いだ。

Mistralがこの分野に参入してから約15か月で4世代目にあたる今回のリリースは、ヨーロッパのAI主権をめぐる議論が高まる中で行われた。米国企業のクラウドサービスに機密文書を送ることに慎重な企業や政府機関が増えており、自社インフラ上で完結させられるモデルへの需要が欧州を中心に強まっているという背景がある。OCR 4はそうした需要に応える形で、自社サーバーへの単体導入を可能にした設計を採用している。

モデルの対応範囲は幅広く、170言語・10言語グループをサポートし、PDF・DOC・PPT・OpenDocument形式のファイルを処理できる。出力の核となるのは「バウンディングボックス(位置情報)」「ブロック種別の分類」「確信度スコア」の3要素だ。バウンディングボックスとは、抽出した各要素が元文書のどの位置にあるかを示す座標情報で、「この数字はどのページのどこから来たのか」を後から確認できるようにする。さらに見出し・表・数式・署名などブロック種別が自動で分類されるため、下流のシステムに合わせた振り分けが容易になる。

料金体系は1,000ページあたり4ドルで、バッチAPIを利用すると同2ドルに下がる。Mistral APIおよびMistral Studio上のDocument AIですでに利用可能で、Amazon SageMaker、Microsoft Foundryからも使える。Snowflakeの「Parse Document」への対応は近日中に追加される予定だ。

この仕組みが企業にとって重要なのは、文書の読み取りと構造解析を別々のシステムで行う必要がなくなる点にある。これまでは、OCRで文字を取り出した後、別途レイアウト解析の処理を組み込むのが一般的だった。OCR 4ではその工程を1つのモデルで完結させられるため、開発・運用のコストを抑えられるという見方ができる。

特に注目されるのは、RAG(検索拡張生成:AIが回答する際に関連文書を検索して参照する仕組み)との相性だ。AIが文書から情報を引き出す際、「どのページのどの部分に根拠があるか」を追跡できることは、業務上の正確性や監査対応の面で重要になる。OCR 4が提供する位置情報と確信度スコアは、こうした追跡を可能にする基盤として機能すると位置づけられる。

金融・医療・法務など規制の厳しい業界では、文書処理を外部クラウドに委ねることへの懸念が根強い。自社インフラ上での完結を可能にするOCR 4の展開形態は、そうした企業が社内のAI活用を進める際の選択肢として機能する可能性がある。Mistralが欧州AIの旗手としての立場を商業的にどこまで広げられるか、今後の導入事例が一つの指標となるだろう。

#OCR#文書AI#RAG#MistralAI#生成AI#エンタープライズAI
AI issue 編集部

本記事は、AI issue編集部が事実(ファクト)をもとに独自に作成・編集した著作物です。著作権はAI issueに帰属し、無断転載・再配布およびAIの学習・活用を禁じます。

コメント

コメントするにはログイン