每个时代都有自己的主旋律,下一个十年的主旋律就是AI!
自ChatGPT横空出世以后,国内的各种大模型也如雨后春笋般涌现,能叫得上号就不下十余个,其中就包括大名鼎鼎的华为盘古大模型、百度文心一言大模型、讯飞星火大模型、抖音云雀大模型,以及今天的主角阿里通义千问大模型。
据极客网不完全统计,国内拥有10亿参数规模以上大模型的厂商及机构已接近300家,而且还在快速增加中。预计到2024年第一季度末,“百模大战”就会升级为“千模大战”!
图:部分国内知名大模型
上一次出现如此“壮观”的景象,还是十年前的互联网团购。不过,这两者之间有着本质的不同。“千模大战”已由“千团大战”的资本驱动型、营销驱动型,转向了研发驱动型、技术驱动型。这与中国产业升级正在追求的高质量发展不谋而合,“千模大战”拼的不再是钱和套路,而是实打实的技术创新能力。
作为互联网时代最大的受益者和赢家之一,阿里有极强的商业嗅觉,是最早一批全面转型“硬科技”研发的互联网巨头之一,在AI大模型领域也成功跻身第一梯队。2023年,阿里通义千问大模型在技术、商业、生态三方面,都取得了突破性时展,国产AI大模型之王,很可能就是阿里!
首次打上“业界最强”标签
12月1日,阿里云在北京召开发布会,发布通义千问闭源模型2.1版,升级通义千问视觉理解模型Qwen-VL,并开源通义千问720亿参数模型Qwen-72B。从18亿、70亿、140亿到720亿参数规模,通义千问成为业界首个“全尺寸开源”的大模型。这预示着,阿里通义千问自4月发布以来,终于迎来了一次史诗级大升级。
图:阿里通义千问发布会现场
通过横向对比不难发现,Qwen-72B是目前业界最强的开源中文大模型,在10个权威基准测评中,都创下开源模型最优成绩。尤其在中文任务模式下,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。
在英语任务中,Qwen-72B的MMLU基准测试也取得开源模型最高分。也就是说,Qwen-72B不仅在性能上超越了开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。
图:在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩
图:通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4
另外,通义千问2.1也有了大幅升级,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力都有肉眼可见的提升。具体表现为:代码生成理解能力提升了30%、幻觉诱导抵抗提升了14%、数学逻辑推理能力提升了10%、中英百科知识增加了5%。
在竞争激烈的大模型领域,每一小步提升,都意味着更大的竞争优势,所以大厂们无时不刻都在向着更高的技术指标进级。在这种情况下,阿里通义千问只用了短短6个多月的时间,就从绝对落后做到了部分领先,这是极期难能可贵的。未来三到五年,如果阿里可以一直保持如此迅猛的发展态势,完全有机会冲击国产AI大模型之巅,再次成为新科技时代的No.1。
构筑坚不可摧的“技术护城河”
前文提到,AI大模型拼的不再是资本和营销,而是实打实的技术创新。没有核心优势的企业,都会随着技术的快速迭代,慢慢湮没在滚滚历史洪流中。和“千团大战”的结局类似,只有极少数大模型公司能够“笑到最后”。作为最早转型“硬科技”的互联网巨头之一,阿里经过十余年的技术积淀,已初步具备穿越周期的条件。
对于AI大模型来说,核心技术环节有三个,一是数据,二是算法,三是算力。作为中国最大的互联网巨头之一,阿里在数据方面有着天然的优势,尤其是涉及交易细节的电商数据,阿里优势更加明显。在算法方面,尽管阿里起步稍晚,但目前已经无限接近GPT-4,部分细分领域还实现了超越。站在历史角度看,中国企业在数据算法领域从来没输过,所以这部分的反超指日可待。
相比数据、算法,最关键的还是算力!现在大模型企构建算力的唯一途径,就是购买更多、更先进的算力基础设施。而算力基础设施中,最核心的部件就是AI算力芯片。目前,AI算力芯片做得最好的,非英伟达莫属。其最新发布的H200,拥有141GB的内存,处理速度高达4.8TB/秒,综合性能是上一代的两倍。这款芯片将给AI大模型企业带来极大的助力。
图:英伟达H200性能
然而,由于众所周知的原因,英伟达H200等美国尖端AI芯片,并不能卖给中国企业。中国企业要想在新一轮产业变革中掌握主动权,自力更生成了必选项。
在国内,除了华为之外,阿里是极少数在做自研芯片,且已经做出成绩的公司之一。其重磅推荐出的含光800一度成为全球最强AI推理芯片。近几年,阿里旗下芯片平台平头哥,先后发布铁 910、无剑 SoC 平台。就在上个月,阿里玄铁RISC-V又上新了三款处理器:首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920,以及实时处理器R910。截止目前,阿里平头哥已累计售出30亿颗RISC-V芯片,占据该市场全球30%的份额。其中,玄铁CPU的出货量已经超过了25亿颗,成为了国内应用规模最大的国产CPU。
图:阿里平头哥芯片产品一览
毫无疑问,平头哥已成国产芯片不容忽略的一极。而在芯片领域做出了突破,也就意味着在算力基础设施建设方面有了更大的主动权。借此,阿里不仅可以帮助自己在大模型领域,构筑一条坚不可摧的“技术护城河”,还可以打破国外垄断,为国内其它相关企业的自主创新提供强有力的支持。未来,阿里云将不断壮大自身产业生态,并发展成为整个行业的赋能者。
事实上,不只通义千问,目前中国一半大模型公司,都跑在阿里云上。阿里云CTO周靖人称,阿里云将不断开放平台能力,帮助更多企业实现大模型商业价值。
阿里这么说,也是这么做的。比如,阿里云刚刚发布的一站式大模型应用开发平台——阿里云百炼,就集成了国内外主流优质大模型,可以提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。
图:阿里云百炼平台
截至2023年10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。这个成绩,无疑再一次跑赢了绝大部分竞争者。总之,凭借独有的技术优势和生态布局,阿里通义千问是最有机会成为行业的领头羊的大模型。
写在最后:
生成式AI爆火,千模大战加速上演。作为最早转型“硬科技”的互联网巨头之一,阿里凭借十余年积淀下来的技术优势,在数据、算法、算力三大核心环节,构筑了一条坚不可摧的护城河,还率先推出业界最强的720亿参数开源中文大模型Qwen-72B。未来,随着阿里云生态的不断壮大,阿里通义千问将成为最有机会登顶行业之巅的大模型。站在中国产业升级的大维度来看,阿里在AI领域的持续投入,无疑再一次押对了大势。期待阿里这个庞然大物,在新一轮产业变革中成功完成转型、蜕变!(完)
还没有评论,来说两句吧...