Copyright 2015-2024 多趣味 版权所有 京ICP备2015051670号
近日,GitHub上一项研究引发业界热议。研究作者称,华为盘古大模型与阿里巴巴通义千问Qwen - 2.514B模型在参数结构上“惊人一致”。 作者实证比较发现,PanguProMoE模型与Qwen - 2.514B模型在注意力参数分布上平均相关性达 0.927,远超其他模型对比正常范围,网友质疑PanguProMoE存在抄袭。 盘古大模型团队在GitHub回应,否认抄袭指控,认为作者评估方法不科学。 截止发稿前,华为官方暂未置评。