CN / EN

37000Cm威尼斯-关于抄袭,华为最新回应

2025-09-25 16:08:31

6月30日,华为高调公布开源其盘古年夜模子焦点组件(Pangu Pro MoE),这一举措被视为构建昇腾生态的要害一步。然而,仅仅四天后,一场突如其来的争议将华为推上了舆论的风口浪尖。​

2025年6月30日,华为高调公布开源其盘古年夜模子焦点组件(Pangu Pro MoE),包括70亿参数浓厚模子及720亿参数的混淆专家模子,这一举措被视为构建昇腾生态的要害一步。然而,仅仅四天后,一场突如其来的争议将华为推上了舆论的风口浪尖。​7UJesmc

争议发作:相似度阐发激发剽窃质疑​

7月4日,一项发布在GitHub的研究激发了业界的广泛存眷。用户@HonestAGI 经由过程“LLM 指纹”技能对于华为盘古Pro MoE模子与阿里巴巴通义千问Qwen-2.5 14B模子举行了深切阐发。成果显示,二者的留意力参数漫衍相似性高达0.927(1.0为彻底一致),这一数值远远凌驾了业内0.7如下的正常差异规模。因为深度进修模子练习的高度随机性,云云高的相似度天然激发了人们对于盘古年夜模子是否涉嫌剽窃的质疑。​7UJesmc

不仅云云,研究者还有于盘古开源的代码文件中发明了明确指向阿里巴巴的版权声明——“Copyright 2024 The Qwen team, Alibaba Group”。这一发明进一步加重了外界对于盘古年夜模子的质疑声浪,不少人认为这是盘古剽窃通义千问的“铁证”。​7UJesmc

华为回应:夸大自力开发与开源合规​

面临汹涌而来的质疑,7月5日下战书,华为旗下卖力开发盘古年夜模子的诺亚方舟试验室迅速发布声明,果断否定了剽窃指控。声明指出,盘古Pro MoE开源模子是基在昇腾硬件平台自力开发、练习的基础年夜模子,并不是基在其他厂商模子增量练习而来。华为还有尤其夸大了其于架构设计、技能特征等方面的要害立异,例如全世界首个面向昇腾硬件平台设计的分组混淆专家模子(MoGE)架构,该架构有用解决了年夜范围漫衍式练习的负载平衡难题,显著晋升了练习效率。​7UJesmc

对于在代码中呈现的阿里版权声明,华为方面注释称,盘古Pro MoE开源模子部门基础组件的代码实现参考了业界开源实践,此中触及其他开源年夜模子的部门开源代码。华为暗示,他们严酷遵照开源许可证的要求,于开源代码文件中清楚标注了开源代码的版权声明,这不仅是开源社区的通行做法,也切合业界提倡的开源协作精力。​7UJesmc

7UJesmc

内部爆料:员工自曝存于套壳、续训、洗水印征象​

然而,就于华为官方发布声明后的第二天,7月6日凌晨,一名自称是盘古年夜模子团队的员工于收集上自曝,称团队内部确凿存于套壳、续训、洗水印的征象。该员工暗示,因为团队早期算力有限,只管做出了诸多努力,但效果其实不抱负,内部质疑声及带领压力与日俱增。于这类环境下,小模子试验室屡次套壳竞品,而带领层对于此采纳了默认的立场,以换取短时间结果。​7UJesmc

7UJesmc

网传华为诺亚方舟试验室员工爆料长文截图7UJesmc

自曝内容还有称,颠末内部门析,盘古Pro MoE现实上是利用Qwen 1.5 110B举行续训,并经由过程加层、扩增ffn维度、添加盘古pi论文的一些机制等方式,凑够了约莫 135B的参数。为了洗失千问的水印,团队甚至采纳了存心练习脏数据等手腕。此外,该员工还有提到团队曾经选择套壳DeepSeekv3举行续训,经由过程冻住DeepSeek加载的参数来举行练习。末了,该员工暗示出在对于技能伦理的对峙,决议去职并暴光这些黑幕。截至今朝,华为还没有对于此自曝内容发表声明。​7UJesmc

业内不雅点:争议袒露AI年夜模子开源的恍惚地带​

这次华为盘古年夜模子的剽窃争议,激发了业内的广泛会商。很多业内子士认为,仅凭“模子指纹”的相似度来判断剽窃其实不彻底科学,由于差别模子于架构设计、练习数据及优化算法等方面存于诸多差异,单一的相似度指标难以周全反应模子之间的瓜葛。此外,代码中呈现的开源版权声明,只能申明华为于开发历程中利用了相干的开源代码,而且遵照了开源和谈,不克不及直接等同在剽窃。​7UJesmc

这起争议也袒露了当前AI年夜模子开源范畴存于的一些问题。今朝,行业对于在模子权重的开源、借鉴以致“化用”,缺少同一、清楚的法令及品德尺度。利用开源模子架构举行从头练习、参考部门实现代码、直接利用或者微调别人练习好的模子权重,这三者之间的边界其实不明确,存于着较年夜的灰色地带。这次事务无疑给整个行业敲响了警钟,怎样于开源的同时掩护常识产权,怎样成立越发科学、规范的模子评估及羁系机制,成了亟待解决的问题。​7UJesmc

截至今朝,涉事的GitHub库已经被删除了,阿里巴巴方面也还没有对于此事发表公然回应。华为盘古年夜模子是否真的存于剽窃举动,今朝尚无确实证据。但不管终极成果怎样,这起争议都将对于AI年夜模子行业的成长孕育发生深远影响,促使企业及研究者越发器重技能立异及常识产权掩护,鞭策行业朝着越发康健、有序的标的目的成长。7UJesmc

-37000Cm威尼斯