중국 제조 LLM이 Claude 초월의 가격 경쟁력 실현
중국 Zhipu AI의 언어 모델 'GLM-5.2'가 Anthropic의 Claude Opus 4.7과 거의 동등한 코딩 성능을 출력 토큰당 약 5분의 1의 비용으로 실현한 것으로, Snowflake CEO의 벤치마크(103개 과제)를 통해 입증되었다. 다만 과제당 토큰 소비량은 Claude Opus 4.7의 약 2배에 달하는 점도 확인되었다. 이러한 가격 경쟁력은 Anthropic, OpenAI 등 구미 주요 AI 연구소의 비즈니스 모델과 기업 가치 평가에 영향을 미칠 것이라는 전망이 나오고 있다.

중국의 AI 기업 Zhipu AI가 개발한 언어 모델 'GLM-5.2'가 Anthropic의 하이엔드 모델 'Claude Opus 4.7'에 버금가는 성능을 훨씬 더 낮은 비용으로 실현하고 있음이 밝혀졌다. 이러한 평가를 제시한 것은 클라우드 데이터 기반 대형 업체인 Snowflake이며, 동사 CEO가 코딩 과제 103건을 활용한 벤치마크 결과를 공개했다.
AI 모델의 성능 비교에서는 '얼마나 정확하게 과제를 수행하는가'와 '회당 얼마의 비용이 드는가' 두 측면이 중요하다. 이번 벤치마크에서는 GLM-5.2가 Claude Opus 4.7과 거의 동등한 정확도를 보이면서도, 출력 토큰(AI가 생성하는 텍스트의 단위)당 요금은 5분의 1 수준에 그친다는 결과가 나왔다. 이러한 가격 차이는 대규모로 이용하는 기업에게 무시할 수 없는 수치라고 할 수 있다.
한편 GLM-5.2에는 주목할 만한 측면도 있다. 동 모델은 하나의 과제를 수행할 때 Claude Opus 4.7의 약 2배의 토큰 수를 소비하는 경향이 확인되었다. 즉, 토큰당 단가는 저렴하더라도 과제 전체로 보면 소비량이 많기 때문에, 비용 우위성이 단순한 단가 비교만큼 크지 않을 가능성이 있다. 그럼에도 불구하고 5분의 1이라는 단가 차이를 기점으로 계산하면, 총비용 측면에서도 상당한 우위성이 남아 있다고 볼 수 있다.
이러한 결과가 나온 배경에는 중국의 AI 개발을 둘러싼 경쟁의 가속화가 있다. 중국에서는 여러 AI 기업이 구미 최고 모델에 가까운 성능을 저렴한 가격으로 제공하려고 경쟁하고 있으며, GLM-5.2는 그러한 흐름 속에서 등장한 모델로 위치지어진다. 구미 측에서는 OpenAI나 Anthropic이 고성능 모델을 높은 단가로 제공해 왔지만, 이러한 비즈니스 모델에 대한 압력이 강해지고 있는 상황이다.
Snowflake 같은 기업이 이러한 비교를 공개한 것에는 업계적 의미가 있다. 동사는 다양한 AI 모델을 고객에게 제공하는 플랫폼을 운영하고 있으며, 비용 대비 성능이 높은 모델을 선택할 동기가 강하다. 그 입장에서 GLM-5.2의 경쟁력을 제시한 것은 순수한 기술 평가를 넘어 조달 판단에 영향력을 가진 정보 발신이라 할 수 있다.
구미의 주요 AI 연구소에게 이러한 움직임은 이중의 의미에서 과제가 될 수 있다. 먼저 기업 고객이 가격이 저렴한 중국 제조 모델로의 이전을 검토하기 시작할 가능성이 있다. 나아가 높은 개발 비용과 높은 단가를 전제로 구축되어 온 기업 가치 평가(밸류에이션)의 근거가 흔들릴 수 있다는 견해도 있다. 모델의 성능 차이가 줄어들고 가격 차이만 두드러지는 상황은 AI 비즈니스의 수익 구조에 대한 재검토를 촉구하는 것이다.
앞으로의 주목점은 GLM-5.2가 실제 업무 이용에서 얼마나 도입을 확대할 것인가, 그리고 Anthropic과 OpenAI가 가격 전략에 어떻게 대응할 것인가이다. 벤치마크상의 수치가 실제 운영에서 어떻게 변할 것인가도 포함하여, 중국 제조 모델의 존재감이 구미 AI 시장의 경쟁 구조를 바꿀 것인가가 문제로 제기되고 있다.
본 기사는 AI issue 편집부가 사실(fact)을 바탕으로 독자적으로 작성·편집한 저작물입니다. 저작권은 AI issue에 있으며, 무단 전재·재배포 및 AI 학습·활용을 금합니다.