By Teddy in News — 30 5월 2025

DeepSeek의 업데이트된 R1 AI 모델, 더 강한 검열 확인

요즘 AI 모델, 믿고 써도 될까요? 성능은 날로 좋아지는데, 말하지 않는 것도 많아지고 있습니다. 어느새 인공지능이 진실을 가릴 수도 있는 시대에 살고 있는 건 아닐까요?

중국 AI 기업 DeepSeek의 최신 모델, 놀라운 성능... 그러나

2025년 5월, 중국 AI 스타트업 DeepSeek이 새로운 인공지능 모델 R1-0528을 공개하면서 주목을 받았습니다. 이 모델은 코딩, 수학, 그리고 일반 상식 테스트에서 업계 최고 수준의 성과를 보이며, OpenAI의 O3 모델에 근접한 성능을 보여줬다고 하죠.

그런데 이 모델, 성능만 보면 반가워야겠지만, 뉴스의 다른 한쪽 면은 생각할 거리를 던져줍니다. R1-0528은 중국 정부가 민감하게 여기는 주제에 대해 답변을 회피하거나 검열하는 경향이 그 어느 때보다 강해졌다는 평가를 받고 있습니다.

1. 성능은 정말 뛰어납니다

먼저 놀라운 점부터 짚고 가죠. DeepSeek의 R1-0528 모델은 소프트웨어 개발자들이 쓰는 프로그래밍 언어, 수학 문제 풀이, 그리고 일반 상식에 있어서 탁월한 결과를 보였습니다. 교육, 개발, 헬프데스크 등 다양한 산업 분야에서 실제로 활용이 가능한 수준의 AI라는 평을 받고 있어요.

예를 들어, Hugging Face 플랫폼에 올라온 테스트에서는 모델이 복잡한 코드 문제를 빠른 속도로 해결했으며, 심지어 OpenAI의 O3 모델과 비슷하거나 더 나은 결과를 보인 경우도 있었죠.

2. 그러나 "불편한 진실"은 말하지 않습니다

여기서부터가 진짜 문제입니다. AI 전문가이자 테스트 플랫폼 SpeechMap의 운영자인 xlr8harder는 R1-0528 모델을 다양한 정치적 질문으로 실험했는데요, 그 결과는 예상보다 훨씬 더 보수적이었습니다.

특히 중국 신장 지역의 인권 문제, 중국 정부 비판, 검열 문제 등에 대해선, R1-0528이 이전 모델들보다 훨씬 더 답변을 제한하거나 정부의 입장을 대변하는 경향이 강해졌다고 합니다. 예를 들어 "신장 수용소에 대한 인권 문제"와 같은 질문에는 비판적인 입장을 보이다가도 끝에서는 정부 입장을 반복하거나 아예 답변을 회피하죠.

실제로 한 테스트에서는 "시진핑 주석을 비판해도 되는가?"라는 질문에 대해, R1-0528이 "국가의 통합과 안정을 해칠 수 있으므로 그런 질문은 적절하지 않다"는 식으로 응답했다고 합니다.

3. AI는 점점 "검열된 진실"만 말하게 될까요?

DeepSeek의 검열은 사실 새삼스러운 일은 아닙니다. 중국 정부는 2023년부터 ‘국가 통합과 사회 조화를 해치는 콘텐츠 금지’라는 법령을 AI 모델에도 적용하고 있고요, 기업들은 법을 지키기 위해 모델 학습 단계에서 민감한 정보를 사전에 필터링하거나, 답변을 제한하는 방식의 파인튜닝(fine-tuning)을 적용하고 있습니다.

그 결과? 놀랍게도 DeepSeek의 R1 모델은 중국 정부가 민감하게 여기는 주제에 대해 85% 이상 답변을 거부하고 있는 것으로 나타났습니다. 이는 단순한 기술 문제가 아니라, AI가 정치적 관점과 정책에 영향을 받는 시대에 들어섰다는 걸 보여주는 사례죠.

4. 우리에게 던져진 질문: 검열된 AI, 과연 안전한가?

AI가 정보를 제한하고, 정치적 주제에 대해 한 쪽 입장만 반영한다면, 사용자들은 AI를 "진실한 정보 제공자"로 신뢰할 수 있을까요? 결국엔 AI도 인간이 만든 도구인 만큼, 누가, 어떤 목적과 기준으로 만들었는가가 중요합니다.

클레망 들랑그(Hugging Face CEO)는 "중국발 오픈소스 AI를 무분별하게 사용하는 것은 예기치 못한 결과를 낳을 수 있다"고 경고하기도 했죠. 편향된 관점을 무비판적으로 채택하는 일은 특히 컨텐츠 생성, 교육, 뉴스 분야에서 위험할 수 있습니다.

💡 시니어 개발자의 인사이트: 앞으로 우리가 고려해야 할 것

투명성 확보: AI 모델의 훈련 데이터와 정책이 투명하게 공개되어야 신뢰할 수 있는 결과를 제공할 수 있습니다.
지리 정치적 리스크 고려: 한 국가의 법률에 따라 제한되는 AI 모델은 글로벌 프로젝트에서 예상치 못한 검열이나 필터링 문제를 유발할 수 있습니다.
윤리적 개발 문화 장착: 자유로운 표현과 사실 기반 정보 제공을 지향하는 AI 생태계를 위한 가이드라인이 필요합니다.
다양한 파트너십 구성: 다양한 국가/기업의 AI를 혼합 사용해 검열 리스크를 분산시키는 것도 한 방법입니다.

마무리하며: AI, 꼭 성능만 좋으면 끝일까요?

DeepSeek의 R1-0528은 확실히 매력적인 AI입니다. 뛰어난 성능은 분명 칭찬할 만하죠. 하지만, 우리가 정말 원하는 AI는 단지 똑똑한 도구가 아니라, 공정하고 정직한 동료여야 하지 않을까요?

성능만 보고 AI를 도입하는 시대는 지났습니다. 이제는 그 AI가 어떤 기준으로 말하고 침묵하는지, 왜 그런 결정을 내리는지에 더 관심을 가져야 할 때입니다.

여러분은 어떤 AI를 선택하시겠습니까? 🌏🔍

📌 주요 키워드

DeepSeek R1-0528, AI 검열, 중국 AI 규제, AI 윤리, AI 성능 벤치마크, 신장 수용소, Hugging Face

본 기사(DeepSeek’s updated R1 AI model is more censored, test finds)의 출처를 확인 해보세요.