레시피 없이 요리를 복제할 수 있는가 : 앤트로픽의 증류 공격 고발

어느 식당에 한 손님이 매일 찾아온다고 해봅시다. 그는 매일 같은 메뉴를 시키고, 한입 한입 정성스럽게 맛을 보고, 식사가 끝나면 말없이 계산하고 돌아갑니다. 그렇게 백 번, 이백 번, 삼백 번. 어느 날 길 건너편에 새 식당이 문을 엽니다. 메뉴 구성이 비슷하고, 요리의 맛이 놀랍도록 닮았으며, 심지어 양념의 미묘한 균형까지 똑같습니다. 원래 식당 주인이 분통을 터뜨립니다. "저 자는 내 레시피를 훔친 것이다!" 그런데 레시피 노트는 여전히 금고 안에 있고, 주방장도 그대로이며, 직원 중 누구도 퇴사하지 않았습니다.

이 장면을 그대로 AI 세계로 옮겨오면 우리는 오늘의 이야기에 도착합니다. 2026년 2월 24일, 앤트로픽(Anthropic)이 중국의 세 AI 기업 딥씨크(DeepSeek), 문샷(AIMoonshot AI), 미니맥스(MiniMax)를 '산업 규모의 증류 공격(Industrial-scale Distillation) Attack'을 가하고 있다며 공개 고발했습니다. 같은 시기에 오픈(AIOpenAI)도 유사한 문제 제기를 이어가고 있지요. 이 고발이 제기하는 질문은 기술적인 문제를 넘어, AI 시대의 지식재산(Intellectual Property)이라는 제도 자체에 대한 근본적 도전이 됩니다.

증류(Distillation)라는 기술 용어부터 짚고 넘어가야 합니다. 원래 AI 연구에서 지식 증류(Knowledge Distillation)는 큰 모델의 '답변 패턴'을 작은 모델에게 학습시키는 정상적이고 인정받는 기법입니다. 선생 모델(Teacher Model)과 학생 모델(Student Model)의 관계에서, 학생이 선생의 출력 분포를 따라 학습하면 크기 대비 뛰어난 성능을 낼 수 있거든요. 문제는 이 기법이 '자기 회사의 선생 모델'을 쓸 때는 정당하지만, '경쟁사의 API를 반복 호출해서 얻은 답변'을 학생 모델에 먹일 때는 이야기가 완전히 달라진다는 점입니다.

▸ 앤트로픽이 고발한 것 : 구체적 장면

앤트로픽이 설명한 패턴을 단순화하면 이렇습니다. 누군가가 클로드(Claude API)에 대량의 질의를 날립니다. 하루에 수십만 건, 수백만 건 단위입니다. 질의의 종류가 기묘하게 체계적입니다. 수학 문제 수만 건, 코딩 문제 수만 건, 추론 문제 수만 건. 그리고 그 질의의 응답을 모두 저장해서, 자사의 모델 훈련 데이터로 사용합니다. 이렇게 만든 학생 모델은 놀라울 만큼 클로드와 비슷한 추론 패턴을 보이게 됩니다.

앤트로픽은 이번 발표에서 API의 사용 패턴 분석, 계정 생성 패턴, IP 추적 등을 통해 이러한 대량 질의의 출처를 일부 특정했다고 주장했습니다. 이용 약관 위반으로 해당 계정들을 차단하는 조치도 병행했지요. 오픈(AI) 역시 2024~2025년에 딥씨크가 자사 모델을 유사한 방식으로 활용했을 가능성을 여러 차례 언급했었습니다. 2025년 1월 딥씨크 R1이 발표되었을 때 미국 업계의 일부에서 이 의혹이 본격적으로 제기되기 시작했고, 그 흐름이 1년여를 거치며 공식 고발로 이어진 것이 2026년 2월의 이 사건입니다.

딥씨크와 문샷(AI), 미니맥스 측은 각자의 방식으로 반박을 내놓고 있습니다. 독자적인 연구와 오픈소스 데이터셋을 사용했다는 주장, 정상적인 API 사용은 약관 위반이 아니라는 주장, 오히려 서구 기업들이 중국의 연구 성과를 폄하하려는 시도라는 주장이 뒤섞여 있지요. 아직 이 공방은 기술적·법률적으로 모두 마무리되지 않은 상태입니다.

▸ 영업 비밀이라는 개념의 재정의

이 사건이 흥미로운 이유는 단순한 '도용' 논란을 넘어서는 개념적 충돌이 숨어 있기 때문입니다.

전통적인 영업 비밀(Trade Secret) 개념은 이렇습니다. 회사의 중요한 정보는 사내 문서·소스코드·공식으로 존재하며, 이것이 외부로 유출되면 영업 비밀 침해입니다. 예를 들어 코카콜라의 레시피, 구글의 검색 알고리즘 소스, 삼성전자의 반도체 공정 설계도 같은 것들이지요. 이 개념에서 '비밀'은 내부에 있는 자료를 가리킵니다.

그런데 AI 모델의 '비밀'은 이런 전통적 개념과 구조가 전혀 다릅니다. 모델의 가중치(Weights)는 여전히 내부 서버에 저장되어 있고, 누구도 그것을 유출시키지 않았습니다. 그럼에도 불구하고 모델의 행동 패턴은 외부로 방출되고 있습니다. API를 통한 질의응답이 바로 그 통로이지요. 즉, 모델의 본체는 금고 안에 있지만, 그 그림자가 API를 통해 외부에 계속 흘러나오는 구조입니다.

이 그림자를 수집해서 비슷한 모델을 만들어내는 행위를 기존 법 체계가 어떻게 평가해야 하는가. 이것이 이번 고발이 던지는 본질적 질문입니다. 저작권(Copyright)인가, 영업 비밀 침해인가, 아니면 단순한 이용 약관(Terms) of Service 위반인가. 각 법리는 서로 다른 결과를 가져옵니다. 이용 약관 위반이라면 당사자 간의 계약 분쟁에 그치지만, 저작권이나 영업 비밀 침해라면 대규모 손해배상 소송으로 번질 수 있는 사안입니다.

유리잔 두 개가 서로를 비추며 한쪽에서 다른 쪽으로 흘러드는 투명한 액체

▸ 그렇지만 : 문제는 그렇게 단순하지 않습니다

이 지점에서 저는 한 발 물러서서 반대 관점을 제시하고 싶습니다. 증류 고발을 '선진 기업 대 후진국 모방자'의 구도로 단순화하는 것은 위험합니다.

첫째, AI 학습의 근본 구조를 생각해보면 오픈(AI)와 앤트로픽도 똑같은 문제에서 자유롭지 않습니다. 이들의 모델은 인터넷 전체의 텍스트, 즉 인간이 수 천 년에 걸쳐 만들어낸 지식을 학습 데이터로 삼았습니다. 뉴욕타임스의 기사, 출판된 책, 각국 언어의 위키백과, 블로그의 글이 모두 포함되어 있고, 이에 대한 정당한 보상이 이뤄졌는지에 대한 소송이 이미 여러 건 진행 중입니다. 그들이 인간의 지식에서 증류해 만든 모델을 중국 기업이 다시 모델에서 증류해 새 모델을 만들었다고 할 때, 이 두 행위를 법적으로 명확하게 구분하는 것이 간단하지 않지요.

둘째, 경쟁 구도의 변화라는 시각도 놓치지 말아야 합니다. 지난 2년간 미국 기업들이 누리던 막대한 기술 격차가 좁혀지고 있다는 불안이 이번 고발의 배경에 있다는 지적이 업계 안팎에서 나오고 있습니다. 2025년 1월 딥씨크 R1의 등장, 그리고 이어진 중국 오픈소스 모델들의 약진이 미국 업계에 안긴 충격은 여전히 현재진행형입니다. 이런 상황에서 '기술 탈취' 프레임을 세우는 것이 전략적 선택일 가능성도 있다는 것입니다.

셋째, 오픈소스의 역설이 있습니다. 딥씨크와 문샷(AI) 모델의 가중치 중 상당수는 실제로 오픈소스로 공개되어 있습니다. 세계 어느 연구자든 그것을 내려받아 연구할 수 있지요. 반면 클로드와 GPT-5는 닫혀 있습니다. 폐쇄 모델 측이 개방 모델 측을 '도용'이라 비난하는 구도 자체가 기묘합니다. 개방된 지식으로 기여한 측과, 그 지식을 폐쇄된 상태로 유지한 측, 어느 쪽이 생태계에 기여하고 있는가라는 다른 질문이 함께 제기됩니다.

▸ 한국 기업이 고려해야 할 것

이번 사건이 한국에게 던지는 함의는 양 방향입니다.

첫째, 한국 기업이 해외 AI의 API를 활용해 자체 모델을 만들려 할 때, 이용 약관 위반 소지가 있는 행위를 명확히 피해야 합니다. 오픈(AI), 앤트로픽, 구글의 약관 모두 '자사 모델 훈련을 위한 데이터 수집'을 금지하고 있습니다. 혁신을 이유로 약관을 무시했다가는, 국제 소송의 피고가 될 수도 있습니다.

둘째, 역으로 한국의 소버린 AISovereign AI 전략을 생각해보면 공개 모델 생태계의 가치가 더 중요해집니다. 오픈소스 기반 위에서 한국어 특화, 한국 법률 특화, 한국 의료 특화 모델을 합법적으로 파인튜닝(Fine-tuning)하는 길은 분명 열려 있습니다. 허깅페이스(Hugging Face) 등의 개방 저장소에 올라 있는 모델들은 라이선스를 지키는 한 자유롭게 활용할 수 있지요. 한국의 스타트업이 법적 리스크 없이 성장하려면, 이 개방된 길을 선택하는 것이 가장 안전합니다.

셋째, 규제의 공백이 있습니다. 한국의 AI 기본법이나 지식재산 관련 법령은 증류 공격 같은 새로운 유형의 침해를 아직 명시적으로 다루고 있지 않습니다. 국제적 논의의 향방을 예의주시하며 국내 법제의 정비를 준비해야 하는 시점입니다.

타원형 테이블 위에 놓인 오래된 레시피 노트와 그 옆의 빈 접시, 그 위로 내려오는 은은한 조명

▸ 레시피가 아니라 요리의 경험

다시 식당 비유로 돌아와 봅니다. 오늘날 AI의 경쟁은 레시피(Recipe)의 싸움이 아니라, 요리가 식탁에 올라올 때의 경험 전체의 싸움이 되고 있습니다. 같은 재료, 비슷한 조리법이라도 누가 어떤 식탁에 어떤 방식으로 올려주느냐에 따라 완전히 다른 서비스가 됩니다. 증류로 비슷한 맛을 재현해도, 오리지널 식당의 단골 고객들은 맛 이상의 경험 때문에 남아 있는 경우가 많거든요.

그렇기에 저는 이 논쟁이 결국 AI 기업 스스로의 차별화 전략을 시험하는 계기가 될 것이라고 봅니다. 증류로 복제 가능한 것은 답변 패턴까지입니다. 그 위에 쌓이는 신뢰·생태계·안전성·고객 경험은 복제할 수 없습니다. 앤트로픽의 책임 있는 확장 정책(Responsible Scaling) Policy, 오픈(AI)의 기업 시장 점유, 구글의 워크스페이스 통합 같은 것들이 이 자리를 지키는 해자(Moat)입니다.

▸ 지식의 흐름은 언제나 강력하다

기술의 역사를 돌아보면, 지식의 흐름은 언제나 벽을 넘어왔습니다. 19세기 영국이 산업 혁명의 기술을 유지하기 위해 직물 기계 도안의 해외 유출을 엄격히 금지했지만, 새뮤얼 슬레이터(Samuel Slater)라는 한 기계공이 모든 설계를 머릿속에 담은 채 미국으로 건너가면서 미국 산업혁명의 시발점이 되었지요. 20세기 냉전 시기 서구의 반도체 기술이 아시아로 이전되던 과정도 단순히 '도용'으로만 설명되지 않습니다. 기술은 흘러가며, 그 흐름을 막으려는 시도는 역사적으로 오래 가지 못했습니다.

앤트로픽의 이번 고발이 법적으로 어떤 결론을 맺을지는 시간이 말해줄 것입니다. 다만 저는 이 사건이 지식재산 제도 자체의 숙제를 공론화하는 계기가 되기를 바랍니다. AI 시대에 '내 것'과 '남의 것'의 경계는 무엇인가. API의 응답은 공개된 것인가, 여전히 비밀인가. 이런 질문들은 한두 건의 고발로 해결되지 않고, 수십 년에 걸친 판례와 입법을 통해 정돈될 것입니다.

여러분은 이 사건을 어느 쪽의 관점에서 바라보고 계신가요. 선생 모델의 편에 서 계신가요, 학생 모델의 편에 서 계신가요, 아니면 제3의 길이 있다고 생각하시나요. 이 질문에 대한 각자의 답이, 앞으로 10년간 우리가 지켜볼 AI 제도 형성의 방향을 정하는 한 조각이 될 것입니다.

#앤트로픽 #딥씨크 #지식증류 #지식재산 #AI법

전체 사이트에서 댓글·관련 글을 함께 보시려면

이야기 공장에서 보기 →