打上“业界最强”标签：阿里通义千问冲击国产大模型No.1

每个时代都有自己的主旋律，下一个十年的主旋律就是AI！

自ChatGPT横空出世以后，国内的各种大模型也如雨后春笋般涌现，能叫得上号就不下十余个，其中就包括大名鼎鼎的华为盘古大模型、百度文心一言大模型、讯飞星火大模型、抖音云雀大模型，以及今天的主角阿里通义千问大模型。

据极客网不完全统计，国内拥有10亿参数规模以上大模型的厂商及机构已接近300家，而且还在快速增加中。预计到2024年第一季度末，“百模大战”就会升级为“千模大战”！

图：部分国内知名大模型

上一次出现如此“壮观”的景象，还是十年前的互联网团购。不过，这两者之间有着本质的不同。“千模大战”已由“千团大战”的资本驱动型、营销驱动型，转向了研发驱动型、技术驱动型。这与中国产业升级正在追求的高质量发展不谋而合，“千模大战”拼的不再是钱和套路，而是实打实的技术创新能力。

作为互联网时代最大的受益者和赢家之一，阿里有极强的商业嗅觉，是最早一批全面转型“硬科技”研发的互联网巨头之一，在AI大模型领域也成功跻身第一梯队。2023年，阿里通义千问大模型在技术、商业、生态三方面，都取得了突破性时展，国产AI大模型之王，很可能就是阿里！

首次打上“业界最强”标签

12月1日，阿里云在北京召开发布会，发布通义千问闭源模型2.1版，升级通义千问视觉理解模型Qwen-VL，并开源通义千问720亿参数模型Qwen-72B。从18亿、70亿、140亿到720亿参数规模，通义千问成为业界首个“全尺寸开源”的大模型。这预示着，阿里通义千问自4月发布以来，终于迎来了一次史诗级大升级。

图：阿里通义千问发布会现场

通过横向对比不难发现，Qwen-72B是目前业界最强的开源中文大模型，在10个权威基准测评中，都创下开源模型最优成绩。尤其在中文任务模式下，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准，得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

在英语任务中，Qwen-72B的MMLU基准测试也取得开源模型最高分。也就是说，Qwen-72B不仅在性能上超越了开源标杆Llama 2-70B和大部分商用闭源模型。未来，企业级、科研级的高性能应用，也有了开源大模型这一选项。

图：在10大权威测评中，通义千问720亿参数模型获得开源模型最优成绩

图：通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4

另外，通义千问2.1也有了大幅升级，在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力都有肉眼可见的提升。具体表现为：代码生成理解能力提升了30%、幻觉诱导抵抗提升了14%、数学逻辑推理能力提升了10%、中英百科知识增加了5%。

在竞争激烈的大模型领域，每一小步提升，都意味着更大的竞争优势，所以大厂们无时不刻都在向着更高的技术指标进级。在这种情况下，阿里通义千问只用了短短6个多月的时间，就从绝对落后做到了部分领先，这是极期难能可贵的。未来三到五年，如果阿里可以一直保持如此迅猛的发展态势，完全有机会冲击国产AI大模型之巅，再次成为新科技时代的No.1。

构筑坚不可摧的“技术护城河”

前文提到，AI大模型拼的不再是资本和营销，而是实打实的技术创新。没有核心优势的企业，都会随着技术的快速迭代，慢慢湮没在滚滚历史洪流中。和“千团大战”的结局类似，只有极少数大模型公司能够“笑到最后”。作为最早转型“硬科技”的互联网巨头之一，阿里经过十余年的技术积淀，已初步具备穿越周期的条件。

对于AI大模型来说，核心技术环节有三个，一是数据，二是算法，三是算力。作为中国最大的互联网巨头之一，阿里在数据方面有着天然的优势，尤其是涉及交易细节的电商数据，阿里优势更加明显。在算法方面，尽管阿里起步稍晚，但目前已经无限接近GPT-4，部分细分领域还实现了超越。站在历史角度看，中国企业在数据算法领域从来没输过，所以这部分的反超指日可待。

相比数据、算法，最关键的还是算力！现在大模型企构建算力的唯一途径，就是购买更多、更先进的算力基础设施。而算力基础设施中，最核心的部件就是AI算力芯片。目前，AI算力芯片做得最好的，非英伟达莫属。其最新发布的H200，拥有141GB的内存，处理速度高达4.8TB/秒，综合性能是上一代的两倍。这款芯片将给AI大模型企业带来极大的助力。

图：英伟达H200性能

然而，由于众所周知的原因，英伟达H200等美国尖端AI芯片，并不能卖给中国企业。中国企业要想在新一轮产业变革中掌握主动权，自力更生成了必选项。

在国内，除了华为之外，阿里是极少数在做自研芯片，且已经做出成绩的公司之一。其重磅推荐出的含光800一度成为全球最强AI推理芯片。近几年，阿里旗下芯片平台平头哥，先后发布铁 910、无剑 SoC 平台。就在上个月，阿里玄铁RISC-V又上新了三款处理器：首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920，以及实时处理器R910。截止目前，阿里平头哥已累计售出30亿颗RISC-V芯片，占据该市场全球30%的份额。其中，玄铁CPU的出货量已经超过了25亿颗，成为了国内应用规模最大的国产CPU。

图：阿里平头哥芯片产品一览

毫无疑问，平头哥已成国产芯片不容忽略的一极。而在芯片领域做出了突破，也就意味着在算力基础设施建设方面有了更大的主动权。借此，阿里不仅可以帮助自己在大模型领域，构筑一条坚不可摧的“技术护城河”，还可以打破国外垄断，为国内其它相关企业的自主创新提供强有力的支持。未来，阿里云将不断壮大自身产业生态，并发展成为整个行业的赋能者。

事实上，不只通义千问，目前中国一半大模型公司，都跑在阿里云上。阿里云CTO周靖人称，阿里云将不断开放平台能力，帮助更多企业实现大模型商业价值。

阿里这么说，也是这么做的。比如，阿里云刚刚发布的一站式大模型应用开发平台——阿里云百炼，就集成了国内外主流优质大模型，可以提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具，为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用，几小时即可“炼”出一个企业专属模型，开发者可把更多精力专注于应用创新。

图：阿里云百炼平台

截至2023年10月，阿里云已与60多个行业头部伙伴进行深度合作，推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。这个成绩，无疑再一次跑赢了绝大部分竞争者。总之，凭借独有的技术优势和生态布局，阿里通义千问是最有机会成为行业的领头羊的大模型。

写在最后：

生成式AI爆火，千模大战加速上演。作为最早转型“硬科技”的互联网巨头之一，阿里凭借十余年积淀下来的技术优势，在数据、算法、算力三大核心环节，构筑了一条坚不可摧的护城河，还率先推出业界最强的720亿参数开源中文大模型Qwen-72B。未来，随着阿里云生态的不断壮大，阿里通义千问将成为最有机会登顶行业之巅的大模型。站在中国产业升级的大维度来看，阿里在AI领域的持续投入，无疑再一次押对了大势。期待阿里这个庞然大物，在新一轮产业变革中成功完成转型、蜕变!（完）