六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

愤怒的蜗牛

两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆式的变革。

12月14日,由量子位主办MEET2024智能未来大会在北京举行。作为国内最具影响力的智能商业峰会之一,MEET大会继续对智能科技的最新进展进行总结和展望,《2023年度十大前沿科技趋势报告》同时正式对外发布。

该报告由量子位智库发起,结合对科技领域的长期跟踪,以及对近百家初创公司、产业研究院、投资机构的深度交流,提名了2023年度十大前沿科技趋势。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

2023年十大趋势涉及六大领域:AI技术、自动驾驶、空间计算、生物科技、太空探索、能源创新。

具体包括:

智能体热潮:人机交互新范式已被大模型打开。
3D生成进入涌现期:新算法新模型爆发,质量效率可控性日新月异。
分割模型大一统:计算机视觉即将迎来“GPT时刻”。
具身智能带来新想象:AGI终极场景下的全新终端。
端到端自动驾驶成共识:BEV+Transformer重构技术路线。
空间计算定义明确:消费级产品问世,XR全栈链路打通。
mRNA打开新象限:提供精准医疗新解法,开启生物医药新篇章。
脑机接口试验新阶段:产品可靠性突破,AI提升数据解码能力。
可回收火箭进入“中国轨道”:工程化难题被突破,商业航天迎来模式闭环。
可控核聚变里程碑:点火成功,打开商用想象。

一、AI技术

智能体热潮:人机交互新范式已被大模型打开

今年的大模型研发热潮同样带动了AI智能体的发展,成为强大的“动力引擎”。目前学术界许多研究已经将大模型作为AI智能体的认知核心,大模型拥有的推理技术和强大的自然语言理解能力,让智能体具备了强大的学习和迁移能力,为智能体的研究提供了突破性的技术方案。

今年在智能体的架构方面有所突破,以更灵活的思维算法技术替代了原有的思维链和思维树的推理方式。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

在智能体交互方面,斯坦福提出的AI小镇也让公众看到了多智能体协同的效益,实现更高效、更智能的决策与行动。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

量子位智库预测未来智能体的发展将有两个方向:

自主智能体和智能体模拟,将分别对应B端、C端需求,能够实现复杂流程的效率提升和提供情感情绪价值。在不久的将来,嵌入自主智能体的软件极有可能改变现有的使用方式,从“用户适应软件”变成“软件适应用户习惯”,真正成为“个人助理”。

3D生成进入涌现期:新算法新模型爆发,质量效率可控性日新月异

在AGI爆火的今年,基于游戏、影视、XR等产业对3D数据的需求不断增长,3D生成领域出现了不少突破性的新算法新模型,在质量、效率、可控性多项关键性能上的学术研究突破日新月异。

今年在SIGGRAPH2023上被评为最佳论文的《3D Gaussian Splatting for Real-Time Radiance Field Rendering》介绍了一种新的可以实现快速高帧率实时渲染的方法——3D Gaussian Splatting。

这一新表达和算法的出现是3D生成领域的一大突破性进展,在部分数据集上多项性能(如速度、质量、可控性)均优于NeRF。

在今年10月,字节跳动的研究团队推出了一种全新的多视图扩散模型——MVDream,能够根据给定的文本提示生成几何上一致的多视图图像。这一新模型可以应用为3D生成的多视图先验,通过分数蒸馏抽样极大地提高了现有的2D提升方法的稳定性,大幅改善了3D一致性问题。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

同时,今年还有多个3D生成优化模型陆续出现。今年OpenAl发布的Shap-E,加州大学圣地亚哥分校发布的One-2-3-45都大大提升了A!生成3D的速度和精确度,其中One-2-3-45能够在仅45秒的时间內从2D图像生成高质量和具备一致性的3D网格。11月刚发布的升级版One-2-3-45++,通过最初微调用于一致的多视图图像生成的2D扩散模型,随后借助于多视图调节的3D原生扩散模型将这些图像提升到3D,全面提升了三维模型的生成质量,但是速度没有太大损失(45秒到60秒)。

分割模型大一统:计算机视觉即将迎来“ChatGPT时刻”

分割一切模型(SAM)是Meta在今年推出的AI模型,10月份相关论文获得ICCV 23的Best Paper Honorable Menthion。受SAM影响,CV领域和相关研究在2023年“再度火热”。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

在SAM出现之前,我们所能看到的其他图像分割模型,都是专有模型,良好性能在其他领域无法体现。SAM的最大贡献即可以快速分割没见过的图像,将之前零散的图像分割模型统一。有CV从业者认为SAM的出现是计算机视觉领域进入“GPT时代”的原因。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

具身智能带来新想象:AGI终极场景下的全新终端

今年是人形机器人和大模型同步迸发的一年,具身智能(Embodied AI)已成为AI研究新热点。

2023年,具身智能领域的几项关键性技术都取得了突破性进展。6月,李飞飞团队发布了具身智能新成果VoxPoser,能从3D空间分析出目标和环境障碍,让真实世界中的机器人在未经培训的情况下直接执行任务。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

DeepMind在今年发布了新的视觉语言模型Robotic Transformer 2(RT-2),可以自动从互联网及机器人数据中学习,学习成功可转化为机器人控制的通用指令。

全世界范围内涌现出各种突破性的仿生机器人产品,大模型影响之下,具身智能将迈入新阶段。

二、自动驾驶

端到端自动驾驶成共识:BEV+Transformer重构技术路线

今年的CVPR最佳论文颁给了端到端自动驾驶,这几乎代表着一种共识:端到端自动驾驶是行业的未来。

随着生成式AI的发展,以ChatGPT为代表的大语言模型的泛化能力有了极大提升,端到端自动驾驶技术也因此受到广泛关注。

端到端自动驾驶技术以全部模块神经网络化为特征,对规则的依赖度低,具备智能涌现能力和跨场景应用潜力。

2023年,城市NOA成为自动驾驶厂商角逐的新方向,基于Transformer模型的BEV技术则成为当下不二的选择。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

BEV+Transformer能够直接生成高质量3D数据,且包含更多有用信息,能够生成更加合理的驾驶指令,有望逐步成为自动驾驶感知的主流范式。

此外,基于BEV的物体可以通过自上而下的视图,完成轨迹预测和路线规划,且能避免图像视角下的尺度和遮挡等问题,也是实现端到端自动驾驶的关键。

三、空间计算

空间计算定义明确:消费级产品问世,XR全栈链路打通

6月苹果在WWDC2023开发者大会上正式推出了第一款空间计算设备Apple Vision Pro,这一代表性消费级空间计算产品的问世,真正将“空间计算”这一概念推向大众并迅速普及。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

空间计算使得计算升维,内容变得更加立体,几乎可以将信息100%复原。

空间计算将成为下一代计算方式,彻底变革传统信息呈现和交互范式,已成为大家的共识。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

今年AIGC的爆发和快速发展也开始解决数字内容快速生产创作的问题,实现了空间计算领域的闭环,XR全栈链路被打通。

同时,空间计算的两大技术路线VST/OST齐头并。代表性空间计算产品商业化落地后,将带动XR开发者生态、内容生态以及供应链逐渐完善。XR设备也向“空间计算平台”定义转变,将进一步推动XR、数字孪生和元宇宙等领域加速增长。

四、生物科技

mRNA打开新象限:提供精准医疗新解法,开启生物医药新篇章

今年,mRNA领域获得令人瞩目的成就,相关技术获得诺贝尔生理学或医学奖。

过去,由于mRNA技术的不稳定性及人体免疫等多原因,无法应用于新药研发。直到脂质纳米颗粒递送技术、碱基修饰技术的突破,解决了mRNA疫苗应用的难题,实现了快速量产。

由于mRNA具有安全性优势、靶点数量优势、疗效优势、制造工艺优势和研发周期优势,可应用于预防疫苗、治疗疫苗、治疗药物等领域。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

在分子设计层面,新提出了线性设计方法以解决在众多mRNA编码序列中的搜索问题,通过动态规划算法降低搜索范围,实现快速定位mRNA编码。

在递送技术层面,6月,宾夕法尼亚大学Drew Weissman 教授和Michael J. Mitchell 教授团队新合成了一种佐剂类脂质,增强了mRNA的递送效率。

脑机接口试验新阶段:产品可靠性突破,AI提升数据解码能力

自脑机接口(BCI)概念提出至今,已经有50年历史。当前脑机接口技术已经进入多个医疗场景,并且进入人体临床试验阶段。

今年,我们看到脑机接口领域的进展集中在神经解码速度的提升上,更接近正常人的文字或语音输出速度。

《Nature》连续发布两篇论文报告新的脑机接口装置。Neuralink在5月下旬宣布,该公司已获得FDA批准,将启动其首个人体临床研究;全球首例非人灵长类动物介入式脑机接口试验在北京获得成功,标志着我国脑机接口技术的突破。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

五、太空探索

可回收火箭进入“中国轨道”:工程化难题被突破,商业航天迎来模式闭环

当前阶段,运载火箭的回收复用已是世界航天的发展趋势,中国众多商业航天企业也正在研制各自可回收复用型号。

航天技术的发展和规模一直受到发射成本的制约。可重复使用的火箭相比于单次发射的火箭在产能有限的条件下可以实现规模更大周期更短的发射。

今年7月,国际上公认的新一代可重复使用火箭发动机技术方向——液氧甲烷发动机实现了工程化突破,蓝箭航天的“朱雀二号”成为全球首款发射入轨的液氧甲烷运载火箭。

4月和11月,公认的“全球最先进的可回收火箭”——星舰进行了两次试飞试验,解决了推进器和火箭的分离等关键问题,具有重大意义。

六、能源创新

可控核聚变里程碑:点火成功,打开商用想象空间

今年以来,核聚变领域的突破不断:

4月,我国EAST装置实现了高功率温度下稳态长脉冲高约束模式等离子体运行403秒,创造了托卡马克装置稳态高约束模运行新的世界纪录。

8月,我国新一代人造太阳“中国环流三号”取得重大科研进展,首次实现100万安培等离子体电流下的高约束模式运行。

近年来,核聚变的底层技术不断突破,尤其是高温超导材料的突破,有望加速实现清洁、低成本核聚变能源的商业落地。

六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革

核聚变作为一种全新的能量来源,因其自身极高的能量密度、清洁等特性,已被产学界定义为人类的“终极能源”。一旦核聚变能够实现规模化发电,将颠覆人类社会的能源供给形式。

除此之外,还有先进算力、卫星互联网、合成生物学、量子计算等提名技术领域值得关注。


您需要 登录账户 后才能发表评论

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,241人围观)

还没有评论,来说两句吧...

目录[+]

取消
微信二维码
微信二维码
支付宝二维码