화웨이, Qwen과 DeepSeek 모델 클론 후 자사 모델이라고 주장

(dilemmaworks.substack.com)

1P by GN⁺ 6시간전 | ★ favorite | 댓글 1개

화웨이가 Qwen과 DeepSeek의 대형 AI 모델을 복제한 후 ‘판구(Pangu)’라는 자체 제품으로 내세웠다는 내부 폭로가 제기됨
판구 팀 내부 직원의 증언에 따르면, 일부 실질적 모델은 직접 개발이 아닌 외부 오픈소스 모델에 기반하여 명칭만 변경된 형태임
실제로 135B V2 및 Pro MoE 72B 등 주요 모델이 Qwen 및 DeepSeek의 구조와 상당 수준 일치함이 기술적으로 드러남
내부에서는 이런 관행이 연구진 사기 저하와 이탈로 이어졌으며, 행정적 비효율과 불투명한 인사 정책도 문제를 심화시켰음
진정한 자주 개발 모델(Pangu V3 등)도 있으나, 복제 관행과 인정받지 못하는 연구문화가 조직 전체 신뢰에 큰 상처로 남음
내부 고발자는 자신의 실명을 걸고 진실을 밝히고자 결심했으며, 조직의 반성과 변화를 촉구함

판구의 비극: 화웨이 Noah Ark Lab 판구 대형 모델의 고통스러운 내막

내부 고발자의 소개 및 현장 분위기

필자는 화웨이 Noah 판구 대형모델 팀 소속으로, 주요 조직-프로젝트 구조 및 리더십 구성을 내부 정보와 맞춰 신분을 인증함
판구 프로젝트는 실제로 연구조직보다 납품조직에 가까웠으며, 반복된 마감과 오버워크, 끊임없는 평가 및 보고의 압박에 시달림
업무 강도와 관료주의가 극심했고, 가족과 장기간 떨어져 숙소 생활, 주말 근무도 빈번한 상황
실질적으로 연구의 자율성과 창의성보다는, 각 상품 라인(Cloud, ICT 등) 납기와 실적 위주의 기업문화가 지배적이었음

잠 못 이루는 밤, 짓밟힌 창작의식

Qwen 모델 표절 논란 이후, 일부 연구진은 수치심과 분노, 무기력감을 동시에 경험함
폭로자 본인은 거대한 기업과 내부 네트워크의 보복이 두려우나, 더 이상의 사실 은폐와 대외 거짓 홍보를 참을 수 없어 양심 고백 결심

기술적 난관 그리고 표절의 시작

초기 판구 모델은 화웨이 Ascend NPU 기반에서 자체 훈련을 시도했으나, 토크나이저 효율성과 모델 성능 부진 등 심각한 시행착오를 겪음
경쟁사(Alibaba, Zhipu)의 GPU 기반 모델에 뒤처졌고, 자체 230B dense 모델 훈련은 실패로 끝남
이에, 소형 모델 랩은 “자체 개발”로 포장했으나, 실제로는 Qwen-1.5 (110B) 모델을 복제 및 소폭 수정한 135B V2를 만들어 공급, 내부에서도 코드·구조 유사성이 드러남
주요 리더십 및 경영진은 이러한 실상을 알고도, 외부 성과와 실적 압박을 이유로 묵인함

진정한 기술 성취: Pangu V3

절치부심 끝에, 팀은 처음부터 완전히 자체 개발한 Pangu V3 (135B Ultra) 모델을 Ascend에서 독립적으로 훈련함
여러 기술적 난관(토크나이저 통일, 손실곡선 안정화 등)을 극복하며, 경쟁사와 유사한 성능을 달성
이 성취는 표절이 아닌 독자적 대형모델 개발의 증거로, 연구진 자부심의 원천이었음

분업 이면의 인정받지 못한 고생

소형모델 랩은 지속적으로 데이터·코드·결과물을 가져가서 손쉽게 모델을 변형/배포했으며, 성과와 포상 등은 주로 해당 조직에 돌아감
이로 인해, 헌신적 연구자들은 조직을 이탈하거나 기술인생의 오점으로 남는 현실을 자조적으로 토로함

224B MoE/718B 클론 등 2차 표절 사례

신규 718B MoE 모델 개발 과정에서도, DeepSeekv3를 거의 그대로 복제한 후 Pangu Pro MoE 72B로 명명하여 배포
내부에서는 이런 관행을 인지했으나, 서로의 생존과 진실 폭로의 두려움으로 쉬쉬하는 분위기

부조리한 행정 관리

진정한 연구진에게는 엄격한 프로세스·모델 계보·감사체계가 적용되어 개발 속도가 지연
하지만 복제 모델의 경우 “위에서 하면 다 통과”하는 이중 잣대가 뿌리 깊게 남아 있음

폭로의 이유와 사임 결심

HonestAGI 사건 이후, 회사 차원의 위기 관리와 내부 은폐 시도가 시작됨
폭로자는 “가짜 보고서”와 내부 공모에 더 이상 동참할 수 없다며, 팀원 명단·보고서에서 본인 이름 삭제 및 자진 퇴사 의향 밝힘

마지막 호소 및 동료에 대한 애정

동료들은 이미 ByteDance, DeepSeek, Tencent, Kuaishou 등 타사로 이직하며 화웨이 인재 유출이 심각함을 보여줌
혁신, 적합한 환경, 적은 정치적 장애가 있었다면 세계적 수준의 대형모델 및 칩 개발도 가능하다고 강조
본 내용의 진실성과 추가 폭로에 따른 본인 및 가족 신변 위협 가능성까지 감수하겠다는 의지 표명

추가 정황 설명

135B V2 클론 사례에서는 소형 모델 랩이 포상·인센티브 등 이익만 챙기고, downstream 지원·유지보수 부담은 원 개발팀(4th brigade)에 전가
Pangu 기술 보고서 저자 표기에도, 실제로 모델 개발에 핵심적 기여를 한 인원이 제외되고 소형 모델 랩 소속 비기여자가 포함되는 등, 불공정한 학술 관행이 만연함

▲

GN⁺ 6시간전 [-]

Hacker News 의견

원글 작성자가 다소 순진한 시각을 드러낸다고 느끼는 입장임. Ascend 팀이 초기에는 (1세대 910A NPU 기준) Nvidia 대비 성능이 부족했었고, 이건 당연한 결과임. 경영진은 바로 상용화 가능한 GPU 기반 대안을 따라가는 팀을 지원했고, 사내 정치로 이런 방향이 굳어짐. Ascend 팀은 결국 기술적 문제를 해결하는 데 성공했지만, 부당한 대우와 관료적 편파, 인정 부족 등으로 많은 멤버가 번아웃되거나 다른 중국 AI 기업으로 이직함. HW(아마도 Huawei)는 오랜 기간 1티어급 인재를 혹사시키는 전략과 문화를 가져왔고, 90년대에도 PRC 통신사가 Nortel, Siemens, Lucent에서 인재를 뽑아갔지만, 서구식 직장문화에 익숙했던 중국계 인재들이 실제 중국 회사 문화에 적응하는 데 어려움을 겪으며 번아웃됨에도 불구하고, HW가 공격적인 워크컬처로 결국 업계를 지배하게 되었음. 지금은 제재 이후 전략 기업이 되어 반도체, 국산 칩, AI로 가치가 크게 높아짐. 현 국제 환경에서, HW는 시장 지배를 위해 어떤 일이든 감행할 수 있는 위치 확보. 이 퇴사 편지를 통해, HW가 결국 충분한 인재 투입으로 Ascend를 작동 가능한 수준으로 올려놨고, 앞으로 Nvidia와 경쟁할 정도로 인재를 계속 투입할 가능성 존재. 저자뿐 아니라 대부분의 직장인은 직원에게 정당한 보상과 좋은 근무 환경 조성이 필수라는 직관 가짐. 하지만 HW의 지난 30년간, 수많은 똑똑한 사람(애국자 포함)들에게 엄청난 연봉을 주고 문제 해결에 투입, 인력이 부서질 때까지 몰아붙이며 이기고 있음
과거 지도 출판사들은 가짜 골목길을 넣어서 저작권 침해를 쉽게 적발했음. LLM에도 이런 방식이 적용될 수 있을지 궁금함
- Malwarebytes 근무 시 IOBit이 DB를 도용한다는 의심이 있었음. 명백한 증거는 있었으나, 일반인도 쉽게 이해할 수 있도록 하기 위해 오직 한 대의 머신에만 존재하는 신제품 프로그램을 만들고, 그 서명을 DB에 추가함. 해당 프로그램은 실제로 유포될 수 없는 비악성물이었고, 상대가 이를 DB에 추가하자 블로그에 공개해 큰 반향 일으켰음. 관련 사례 IOBit 도용 사건
- 대표적인 사례로는 컴퓨터 칩에 의도적으로 미세하고 무해한 결함 내지는 이상현상을 넣는 방식임. 중국이 만든 많은 제품들이 TI 등 타사의 리버스엔지니어링 결과물이라 이런 결함이 많음. 심지어 중국 내부에서도 서로 이런 짓을 함. 모두 똑같이 편법 사용이라는 인식임
- OML 1.0: Fingerprinting이라는 프로젝트 예시를 경험한 적 있음. LLM 소유권 식별과 무단 사용 방지를 위해 지문을 모델에 삽입하는 도구임
- 유튜버 Jay Foreman이 지도 속 가짜 골목길 관련 영상 제작했던 사례 있음
- 원문 중국어 고발글에 다음 내용이 있었음: Honestagi 분석이 매우 오랜 추가 학습을 거친 모델임에도 높은 유사성을 보인 점에 놀랐음. 이 모델의 파라미터를 세탁하기 위해 투입한 컴퓨팅 자원은 동급 모델을 새로 만드는 데 충분한 수준이었음. 동료 말로는, Qwen의 워터마크를 지우려고 오염된 데이터로 일부러 학습하는 등 여러 시도도 했다고 함. 이 방식은 앞으로 모델 혈통 연구 분야에 전례 없는 사례로 남을 것이며, 차후 새 연구 방법론 검증 때 본보기로 사용 가능함
Apple은 Qwen2.5-Coder-7B를 기반으로 하면서 자체적인 아이디어를 접목시킨 LLM을 선보임. 주요 변화는 애플의 자체 코드 예시로 커스텀 학습시킨 점이며, 온도를 올려주면 여러 코드 블록을 순서 무시하고 생성할 수 있음. 관련 기사 Apple LLM 관련 소식 HN 토론
매우 인간적이고 솔직한 보고서임. 대기업 내부의 혼란과 경영진이 부정직한 팀에 더 유리하게 압박을 가하는 구조를 보여줌. 작성자는 회사를 떠났으며, 인품이 좋다는 평가임
- 사실 이 보고서는 최근 중국에 잇따라 등장한 다른 퇴사 편지들과 맥락을 같이 해야 함. 최근 15년차 Alibaba 베테랑의 퇴사 글도 큰 기업 문화 쇠락이 경쟁력 약화와 신제품 실패의 원인임을 비판함. 보고서 논점은 다음과 같음: 1. Huawei 역량에 대한 국가적 차원의 허위 2. 유료 고객 대상의 허위 3. KPI 집착 관리체계 하에서 성과지표 조작이 사실상 묵인/조장되는 현실 (이와 작성자의 이상, 신뢰 상실이 보고서 핵심임)
"토요일은 기본적으로 근무일이지만, 때로는 오후 티타임이나 심지어 새우요리도 먹을 수 있었음"이라는 문장에 시적 감성이 느껴짐. 이런 상황에 민물가재가 제공되는 특별한 이유가 있는지 궁금함
- "토요일 근무임에도 간혹 간식이 나왔고, 민물가재도 그만큼 인기일 수 있음, 혹은 오역일 수도 있음"이라는 추측임
"우리는 '제4야전군' 프로젝트 산하에 있고, 코어 언어 LLM은 4여단, Wang Yunhe의 소형 모델 그룹은 16여단"이라는 조직 설명을 보고 의아해함. 이게 실제로 공산당 군대 소속 조직인지 의문임
- 실제 제4야전군은 1955년 이후 존재하지 않고, LLM 프로젝트 코드네임 용도로 계속 쓰이는 네이밍일 가능성이 높다는 견해임
- Huawei의 군대식 기업문화 언급. 신입사원 오리엔테이션도 군대 교육 수료식처럼 운영함. 참고자료 화웨이 군사식 문화
실제로 원초적 모델은 누가 만들었는지에 대한 질문 제기임
과거 Huawei Lab 멤버가 모델 훈련을 실제로 방해하다가 해고된 사례가 있었으며, 위 고발 당사자인지 의심된다는 의견임
- 아마도 언급한 사례는 ByteDance 인턴이 AI 모델에 악성코드 심었다가 해고된 사건으로 추정함. 관련 기사 bytedance-intern-fired

답변달기