AnthropicがAlibabaによるClaudeの能力盗用を主張
AnthropicはAlibabaが「モデル蒸留」と呼ばれる手法を使い、自社AIモデル「Claude」の出力を不正に流用して自社モデルの性能を高めた疑いがあると主張している。この問題は、AIサービスを利用する企業が、AI事業者のデータ管理方針を適切に審査する必要性を改めて示すものだ。

AIスタートアップのAnthropicは、中国の大手テクノロジー企業Alibabaが自社の大規模言語モデル「Claude」の能力を不正に流用したと主張している。いわゆる「モデル蒸留」と呼ばれる手法を使って、Claudeの出力を学習データとして利用し、自社モデルの性能を引き上げた疑いがあるというものだ。
モデル蒸留とは、高性能なAIモデル(教師モデル)の出力結果を使って、別のモデル(生徒モデル)を効率よく学習させる技術を指す。正規の用途では広く使われる手法だが、サービス利用規約の許可なく他社モデルの出力を大量に使って自社モデルを強化することは、知的財産の侵害にあたる可能性がある。Anthropicが問題視しているのは、まさにこの規約外の利用だ。
AI企業各社は一般に、自社モデルへのAPI(アプリケーション・プログラム・インターフェース)アクセスを通じて出力を取得し、それを競合モデルの学習に利用することを利用規約で禁じている。Anthropicも同様の規定を設けており、今回の主張はその規約違反を指摘するものだ。一方で、Alibabaからの公式なコメントや反論については、現時点では確認されていない。
この問題が浮上した背景には、AI開発競争の激化がある。各社がより高性能なモデルを少ないコストで開発しようとする中、競合他社のモデル出力を「抜け穴」として活用しようとする誘引が生まれやすい構造がある。特に、クローズドな高性能モデルが世界的に普及している現在、その出力データは事実上、開発の近道として機能しうるという見方ができる。
今回の件は、AIサービスを利用する企業にとっても無関係ではない。自社のデータや業務にAIを活用する際、そのAI事業者がデータをどのように管理・利用しているかを確認する「デュー・デリジェンス(適正審査)」の重要性を改めて示している。AIラボが収集した大量の利用データは、競合他社に悪用されるリスクを内包しており、利用企業側も利用規約やデータ管理ポリシーを精査する必要があると位置づけられる。
知的財産をめぐるAI企業間の対立は、今後さらに表面化する可能性がある。学習データや出力の利用に関するルールが世界的にまだ整備途上にある中、今回のAnthropicとAlibabaの対立は、業界全体のガバナンスのあり方を問い直す一例になるという見方ができる。今後は法的な判断や両社の公式声明の動向に注目が集まるだろう。
本記事は、AI issue編集部が事実(ファクト)をもとに独自に作成・編集した著作物です。著作権はAI issueに帰属し、無断転載・再配布およびAIの学習・活用を禁じます。