DeepMind大模型突破60年数学难题,解法超出人类已有认知

愤怒的蜗牛

你能看出下面这两张图,哪张是实景,哪张是虚拟吗?

DeepMind大模型突破60年数学难题,解法超出人类已有认知

熟悉的玩家们大概能一眼认出来——最近,这支游戏预告片还没出几天,全球播放量瞬间破亿!

其中对现实场景的超逼真还原,让无数玩家们激动到颤抖。

不仅建模的细节好到可怕,看起来完全就是真实的人。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

而且游戏中海滩和港口的镜头,也几乎和无人实拍的视频一模一样。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

为何能如此以假乱真?背后功臣,就是Rockstar全新升级的游戏引擎。

不过,如果你以为游戏引擎只能在游戏中大放异彩,那你可就错了。

如今,游戏科技已经赫然跻身为硬科技,在实实在在反哺着民航、汽车、建筑、影视、动画等行业。

超逼真还原,无限模糊虚实边界

为啥游戏科技能对这些行业进行加持?其中一大原因自然是——现在的游戏技术对于现实世界的模拟,太逼真了!

能做到如此逼真的模拟,首先不得不提的,就是游戏引擎中的3D渲染技术了。

3D渲染

为了带给玩家极致的体验,游戏厂商在画质和特效方面的追求,是永无止境的。而3D渲染的出现,让视觉特效有了重大飞跃。

《塞尔达传说:王国之泪》、《刺客信条:奥德赛》之所以在玩家中人气爆棚,部分原因就是它们惊艳的渲染效果。

英伟达DLSS深度学习超级采样技术,更是通过AI超高分辨率,重新定义了实时渲染。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

在《赛博朋克2077》中,RTX光线追踪+DLSS 3帧生成,直接实现了电影级实时渲染!

因为效果太喜人,在前沿的XR领域,3D渲染也扮演着关键角色。

前段时间,小扎与知名播客主播Lex Fridman带上全新Quest头显开启了「真人对谈」,逼真效果惊艳了全世界。

对谈中,由于实时渲染效果太过强悍,甚至让Fridman感慨:自己一度忘了眼前的小扎不是真人!

DeepMind大模型突破60年数学难题,解法超出人类已有认知

在不同光照效果下,虚拟化身的脸部阴影变化,也更为细腻真实。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

这项技术的背后,正是Meta在2019年首次提出的Codec Avatars项目的成果,它可以逼真还原虚拟化身的面部表情和动作。

最近,Codec Avatars实验室又在一项新研究中,提出了「可重光高斯编解码器」。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

论文地址:https://arxiv.org/abs/2312.03704

它可以让虚拟化身,从任何视角进行实时渲染,让光照的变化更加自然。

通过「全局光传输」和「空间全频反射」等技术,不仅面部的光照变化更真实,连头发丝、眼球、嘴型等更细节的部位,呈现了3D实时渲染。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

物理模拟

游戏引擎中的另一重磅技术,就是物理模拟。

逼真的视觉效果不仅包括物体呈现的外观,还包括其行为方式。

举个例子,当你用炸药包去爆破一堵墙时,随着一声巨响,这堵墙也跟着轰然倒塌。但如果这堵墙纹丝不动,就会不禁让人怀疑,是不是开发商又在偷工减料了。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

而游戏引擎的终极目标之一,就是还原一个完全遵照现实物理学定律的模拟世界。

这里说的模拟,是用刚体物理学、软体物理学、流体动力学以及其他相关的东西模拟原子如何相互作用。

比如,模拟光与物体的表面相互作用,最终呈现出我们平时所看到的外观。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

英伟达Omniverse

当我们能足够近似地模拟真实世界的时候,也就获得了相应的「超能力」。

比如,在模拟世界中预测一部手机会以怎样的姿态掉下,落地之后屏幕会不会碎,等等。

也就是说,我们可以无限次地测试在不同决策和条件下产生的结果,甚至探索所有可能出现的「平行世界」。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

除了刚刚提到的渲染和模拟,游戏引擎发展到现在,已经拥有了相当庞大且复杂的功能。

逼着开发者做到这一步的,正是游戏玩家们越来越刁钻的需求。

更有趣的是,原本为了「讨好」玩家们而日新月异的游戏引擎,早已在工业、影视、医学等领域,造福我们的生活了。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

它加持的行业,你想象不到

补足自动驾驶边缘场景

英伟达CEO黄仁勋曾在外媒的采访中表示,在开发自动驾驶汽车时,必须要有一个数字孪生环境。这样你就可以根据虚拟演示来测试新软件,不必马上把实验车放在真实街道上。

毕竟,没人会愿意真正将人或动物置于高危中,但自动驾驶汽车生产者肯定需要了解产品在各种危险边缘环境里将如何表现。

而英伟达基于游戏引擎等技术搭建的Omniverse平台,便可以模拟出物理级精确的大型虚拟世界。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

在Omniverse里,日夜可以随时倒换,并且可以模拟包括冰雪环境、急速过弯等情景。 行人与动物也可以安置在真实世界中绝不会安排的危险场景内。

此外,为了能够让自动驾驶技术帮助司机应对一些很少见的突发状况,比如前车上的异物掉落,交通标志掉落,现实生活中很难找到类似的训练数据,就只能在Omniverse中的虚拟场景中用生成的数据进行训练。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

助力突破民航技术难题

下面这个用例,就更让人意想不到了。

腾讯的一群游戏开发者,联合南航,基于自研游戏引擎技术和虚像显示技术,开发了一个工业级民航系统,结果竟助力突破了我国民航的一大技术难题!

要知道,每位民航飞行员,都需要在高等级模拟机上完成超1000小时的飞行训练,而高等级模拟机是现代航空业最不可或缺的装备之一,一般售价在8千万到1亿人民币之间。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

通常讲,飞行员70%的信息来自于视觉,因此全动飞行模拟机最关键的部件之一,就是视景系统。

通过这一系统,飞行员能够以真实驾机的第一视角,将各种飞行时段的拟真图像尽收眼底。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

从上个世纪70年代开始,出现了计算机成像视景系统,成像技术和效果得到了极大提升。

但由于是封闭的工业软件平台,整体技术迭代缓慢,除了无法对光影效果进行很好的还原,渲染效果不真实,资产制作流程还非常依赖手工制作,生产效率低下。

游戏引擎作为计算机图形处理技术的集大成者,提供了针对性的解决方案。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

游戏AI+PCG+AIGC内容生成技术可以做到半天完成一座大型城市的全景建模,3天高精度复原一座机场

腾讯和南航联合研发的首个完全自研的国产全动飞行模拟机视景系统,性能相比于市场主流的产品,建模更加高效,成像更加真实。

在成像方面,腾讯利用自研游戏引擎,可以模拟出一个超写实、地球级的飞行场景。

多边形生成面数提升380倍、贴图精细度提升100倍,不仅支持4K分辨率,而且重建出逼真的数字世界细节满满,真假难辨。

再加上南航自研高光学性能虚像技术,解决了画面扭曲、偏色和亮度衰减等问题,不论是日出日落、降雨等场景都有精细画质体验。

值得一提的是,利用这套新一代视景系统,仅需要3天的时间,就可以建好一座高精度机场,建模效率飙升10倍还多。

另外,基于对GPU/CPU的性能优化,系统渲染的速度更是达到了4K 60FPS不卡顿不掉帧的严格工业标准。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

系统实机运行时,能达到4K 60FPS 0丢帧0卡顿的严格工业标准,成像无比真实

权游西部世界,都有它

现在,游戏引擎也越来越成为电影制作人的新宠。

起初,好莱坞对游戏引擎的使用,主要限于斯皮尔伯格等开创的前期可视化流程,但随着实时计算优化的图形处理芯片组越来越强大,游戏引擎已经贯穿了生成流程的全过程。

多部漫画电影、星战电影,以及《曼达洛人》、《权力的游戏》、《西部世界》等剧集中,都用到了游戏引擎。

在《权力的游戏》中,制作公司The Third Floor创造了剧中一些最令人难忘的场景。而在《权力的游戏》中积累的经验,也让他们充满信心,开始在整个公司全面采用虚幻引擎。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

2019年开播的美剧《曼达洛人》,有一半的镜头都是借助游戏引擎完成的,直接让团队在现场就完成了影片的最终镜头效果。从此,游戏引擎成为「最终像素」的生产工具。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

《曼达洛人》中基于LED和虚幻引擎的StageCraft虚拟拍摄系统

而且,引擎内容不再是虚拟元素,所拍即所得,而是成为实拍的一部分。

可以想象,随着图形显卡性能和软件算法的提升,未来的电影制作将不断突破我们的想象。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

看完上面这些例子不难发现,「游戏引擎」绝不仅仅能在游戏领域发光发热,它已经变成了跨行业、跨场景应用的数字交互引擎。

游戏科技,其实是硬科技

看到这里,让我们深入思考一下:游戏的功能和本质,到底是什么?

在哲学家和心理学家看来,游戏是虚构的假象,但游戏者却在其中获得了真实的体验。

其中的重要分类电子游戏,则是基于电脑计算能力,按一定逻辑模式/计算序列(计算序列)对人类假想行为模拟或抽象的交互程序。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

1947年早期的电子游戏《阴极射线管娱乐装置》

其实,游戏的发展,以及作为游戏行业技术底座的游戏科技,早已和每个年代的科技创新交织在一起——

让我们把时间线拉长一点,站在科技史的视角回望,就会发现从上世纪50年代开始,游戏早已被应用到AI的发展历程之中。

就比如,1951年Christopher Strachey使用第一台商业化通用型计算机Ferranti Mark 1,写出了第一个西洋跳棋程序。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

70年代开始,电子游戏如雨后春笋般爆发。1978年发行的「太空侵略者」,其设计者把AI引入了射击游戏的理念深得人心,一经发布瞬间爆火。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

时间继续向前推进,90年代游戏显卡横空出世,游戏引擎的出现也在不断刷新游戏能力探索的边界,英伟达、UE都是典型的代表。

直到今年生成式AI大爆发,AIGC成为继PGC、UGC之后内容生产创作的全新方式。

在剧本编写、AI虚拟玩家、美术音频等各个游戏创作环节中,AIGC大幅提升了生产效率、降低了成本,还带来了极具挑战性和娱乐性的游戏体验。

从历史中我们不难看出,游戏与科技发展密切交织在一起,而这也体现出了游戏本身具有的强科技属性。

当我们进入2023年,游戏于生产力维度,也在发生着深刻变化。如今游戏的生产力,已经远远超越了游戏行业本身。

根据咨询机构FTI近期发布的研究,游戏科技已经在欧洲国家的影视工业、医疗保健、文物保护、汽车、制造业、能源开采等领域体现出了价值。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

可以说,游戏科技已然成为能影响许多领域技术和应用创新的「硬科技」。

所谓硬科技,即是指基于科学发现和技术发明,需要长期研发投入和积累,具有较高技术门槛,难以被复制模仿,对经济社会发展有重大作用的核心技术。

我们很容易想到的一个例子,就是芯片。

无论在设计、制程、封装、测试等各环节,芯片的研发都有着极高的门槛;而在通信、汽车、医疗、工业等领域,芯片都是电子产品中不可或缺的组成部分。

DeepMind大模型突破60年数学难题,解法超出人类已有认知

芯片制造流程

同样,游戏科技也严格符合这个标准。

编程语言、图形学、游戏引擎、物理引擎等技术都有着高门槛。今年9月,游戏引擎顶流Unity突如其来的「付费公告」,直接让众多使用其技术打造工业数字孪生场景的企业惨遭「卡脖子」。

与此同时,游戏科技在民航、工业、影视等领域的发展上,也如芯片等技术一样,起到了至关重要的作用。

的确,作为硬科技的一种,套上了「趣味性」外壳的游戏科技,正切切实实在打造着人类社会的新基建。

再比如,中国音数协和工信部工业文化发展中心昨日刚刚发布的《超级数字场景源动力——游戏科技与创新应用研究》报告,也对游戏科技在不同领域里的贡献率进行了量化。

其中,2022年,游戏科技对芯片产业的跨行业科技进步贡献率为18.65%;

对AI行业的科技进步贡献率为31.37%;

对云计算产业的科技进步贡献率为51.08%;

对手机行业的科技进步贡献率为46.76%;

对于XR行业的科技进步贡献率为72.45%;

对自动驾驶的科技进步贡献率为57.19%;

对远程医疗行业的科技进步贡献率为17.47%;

对于工业设计服务行业的科技进步贡献率为29.47%。

凡此种种,都证明了如今的「游戏」早已不再是单纯的娱乐,而我们也应该换一种方式去重新认识。

随着社会对更强大数字生产力的需求愈发迫切,在人工智能与场景建设领域有着巨大优势的游戏科技,以融合了人工智能、计算机图形学和算力的全新姿态,让超级数字场景成为游戏的本质属性。

也正是通过更开放的超级数字场景的连接,游戏科技也在越来越广泛的社会生产领域中,释放出巨大的数字生产力,创造出越来越大的社会价值。

现在,游戏科技发展带动的技术爆炸,已经展现出了产业的大融合。而在未来,游戏科技一定会给人类「炸」出更多的惊喜。


您需要 登录账户 后才能发表评论

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,320人围观)

还没有评论,来说两句吧...

目录[+]

取消
微信二维码
微信二维码
支付宝二维码