Anthropic이 Alibaba의 Claude 능력 도용 주장
Anthropic은 Alibaba가 '모델 증류'라고 불리는 기법을 사용하여 자사 AI 모델 'Claude'의 출력을 부정정당하게 유용하여 자사 모델의 성능을 향상시켰을 의혹을 제기하고 있다. 이 문제는 AI 서비스를 이용하는 기업이 AI 사업자의 데이터 관리 정책을 적절히 검토할 필요성을 다시금 보여주는 사례다.

AI 스타트업 Anthropic은 중국의 대형 기술 기업 Alibaba가 자사의 대규모 언어 모델 'Claude'의 능력을 부정정당하게 유용했다고 주장하고 있다. 이른바 '모델 증류'라고 불리는 기법을 사용하여 Claude의 출력을 학습 데이터로 이용하고 자사 모델의 성능을 높였을 의혹이 있다는 것이다.
모델 증류란 고성능 AI 모델(교사 모델)의 출력 결과를 사용하여 다른 모델(학생 모델)을 효율적으로 학습시키는 기술을 말한다. 정규 용도에서는 널리 사용되는 기법이지만, 서비스 이용 약관의 허가 없이 타사 모델의 출력을 대량으로 사용하여 자사 모델을 강화하는 것은 지적재산권 침해에 해당할 가능성이 있다. Anthropic이 문제 삼는 것은 바로 이러한 약관 위반의 이용이다.
AI 기업들은 일반적으로 자사 모델에 대한 API(애플리케이션 프로그램 인터페이스) 접근을 통해 출력을 획득하고 이를 경쟁 모델의 학습에 이용하는 것을 이용 약관에서 금지하고 있다. Anthropic도 유사한 규정을 두고 있으며, 이번 주장은 그 약관 위반을 지적하는 것이다. 한편 Alibaba의 공식 의견이나 반박에 대해서는 현재 확인되지 않고 있다.
이 문제가 부상한 배경에는 AI 개발 경쟁의 심화가 있다. 각사가 더욱 높은 성능의 모델을 낮은 비용으로 개발하려는 가운데, 경쟁사의 모델 출력을 '허점'으로 활용하려는 유인이 생기기 쉬운 구조가 있다. 특히 폐쇄형 고성능 모델이 전 세계적으로 널리 보급되어 있는 현재, 그 출력 데이터는 사실상 개발의 지름길로 기능할 수 있다는 관점이 있다.
이번 사건은 AI 서비스를 이용하는 기업에게도 무관하지 않다. 자사의 데이터나 업무에 AI를 활용할 때 그 AI 사업자가 데이터를 어떻게 관리·이용하고 있는지를 확인하는 '실사(적정 심사)'의 중요성을 다시금 보여주고 있다. AI 랩이 수집한 대량의 이용 데이터는 경쟁사에 의한 악용 위험을 내포하고 있으며, 이용 기업도 이용 약관과 데이터 관리 정책을 정밀하게 검토할 필요가 있다고 위치지을 수 있다.
지적재산을 둘러싼 AI 기업 간 대립은 향후 더욱 표면화될 가능성이 있다. 학습 데이터와 출력의 이용에 관한 규칙이 전 세계적으로 아직 정비 진행 중인 상황에서, 이번 Anthropic과 Alibaba의 대립은 업계 전체의 거버넌스의 방식을 다시 문제 삼는 사례가 될 수 있다는 관점이 있다. 향후 법적 판단과 양사의 공식 성명의 동향에 주목이 집중될 것으로 보인다.
본 기사는 AI issue 편집부가 사실(fact)을 바탕으로 독자적으로 작성·편집한 저작물입니다. 저작권은 AI issue에 있으며, 무단 전재·재배포 및 AI 학습·활용을 금합니다.