中国製LLMがClaude超えの価格競争力
中国Zhipu AIの言語モデル「GLM-5.2」が、AnthropicのClaude Opus 4.7とほぼ同等のコーディング性能を、出力トークンあたり約5分の1のコストで実現したことが、Snowflake CEOによるベンチマーク(103タスク)で示された。ただし、タスクあたりのトークン消費量はClaude Opus 4.7の約2倍にのぼる点も確認されている。この価格競争力は、AnthropicやOpenAIといった欧米主要AIラボのビジネスモデルや企業評価に影響を与えるという見方が出ている。

中国のAI企業Zhipu AIが開発した言語モデル「GLM-5.2」が、Anthropicのハイエンドモデル「Claude Opus 4.7」に匹敵する性能を、はるかに低いコストで実現していることが明らかになった。この評価を示したのはクラウドデータ基盤大手Snowflakeで、同社CEOがコーディングタスク103件を用いたベンチマーク結果を公表した。
AIモデルの性能比較では、「どれだけ正確にタスクをこなせるか」と「1回あたりいくらかかるか」の両面が重要になる。今回のベンチマークでは、GLM-5.2はClaude Opus 4.7とほぼ同等の精度を示しながらも、出力トークン(AIが生成するテキストの単位)あたりの料金は5分の1程度にとどまるという結果が出た。この価格差は、大規模に利用する企業にとって無視できない数字といえる。
一方で、GLM-5.2には注意すべき側面もある。同モデルは1つのタスクをこなすにあたり、Claude Opus 4.7の約2倍のトークン数を消費する傾向があることが確認された。つまり、1トークンあたりの単価は安くても、タスク全体でみると消費量が多いため、コスト優位性は単純な単価比較ほど大きくはない可能性がある。それでもなお、5分の1という単価差を起点に計算すると、総コストでも相応の優位性が残るという見方ができる。
こうした結果が出た背景には、中国のAI開発をめぐる競争の加速がある。中国では複数のAI企業が、欧米トップモデルに近い性能を低価格で提供しようとしのぎを削っており、GLM-5.2はその流れの中で登場したモデルと位置づけられる。欧米勢ではOpenAIやAnthropicが高性能モデルを高単価で提供してきたが、このビジネスモデルへの圧力が強まっている状況だ。
Snowflakeのような企業がこの比較を公表したことには、業界的な意味がある。同社はさまざまなAIモデルを顧客向けに提供するプラットフォームを運営しており、コストパフォーマンスの高いモデルを選ぶ動機が強い。その立場からGLM-5.2の競争力を示したことは、単なる技術評価を超えて、調達判断への影響力を持つ情報発信といえる。
欧米の主要AIラボにとって、この動きは二重の意味で課題となりえる。まず、企業顧客が価格の安い中国製モデルへの移行を検討し始める可能性がある。さらに、高い開発コストと高単価を前提に組み立てられてきた企業評価(バリュエーション)の根拠が揺らぐという見方もできる。モデルの性能差が縮まり、価格差だけが際立つ状況は、AIビジネスの収益構造に対する問い直しを迫るものだ。
今後の注目点は、GLM-5.2が実際の業務利用でどこまで採用を広げるか、そしてAnthropicやOpenAIが価格戦略をどのように対応させていくかにある。ベンチマーク上の数字が実運用でどう変わるかも含め、中国製モデルの存在感が欧米AI市場の競争構造を変えるかどうかが問われている。
本記事は、AI issue編集部が事実(ファクト)をもとに独自に作成・編集した著作物です。著作権はAI issueに帰属し、無断転載・再配布およびAIの学習・活用を禁じます。