帖子详情 您在阅读帖子内容并对帖子进行投票之后,可发表回复。

微软XboxSeriesX的黑科技第一集:游戏历史上最具革命性的技术,Xbox Velocity架构

作者:kideny    访问次数:3751    投票总数:2   
创建时间:2020-06-22 11:10:31   

在之前我们介绍天蝎座架构的黑科技时候,提到一个比较通俗易懂的概念,凡是技术名词里面带有“硬件”两个字的技术一般都是很厉害的黑科技。微软的XboxSeriesX游戏机,即延续了天蝎座架构的诸多黑科技,还扩展并增加了大量的游戏机专用的黑科技。微软是一家专注于搞研发的技术公司,虽然研究了大量的黑科技,但是不擅长与营销和推广。接下来,我将用一系列的文章,继续介绍微软在XboxSeriesX这一时代的游戏机架构当中,又有那些激动人心的黑科技。今天要分享的是,微软为次世代游戏机准备的全新黑科技,支持硬件解压缩的Xbox Velocity架构,下文部分场合简称XVA。

 

微软XboxSeriesX的Xbox Velocity架构简介

 

这个全新的Xbox Velocity架构主要包含四大部分:

 

第一是:微软自定义的NVMe SSD,下文将用Xbox和PS5的SSD进行比较,通过对比让大家了解XSX这款SSD的真正实力。

 

第二是:专用的硬件解压缩模块和BCpack算法,特别是微软公司针对游戏纹理开发的BCpack算法,跟支持硬件加速的DX12处理器一样,这是完全领先竞争对手很多年的的技术了。

 

第三是:DirectStorage API, DirectStorage是一个全新的专门为游戏而设计的I/O系统 , 以释放SSD的全部性能和硬件解压缩能力。这项黑科技同样能够解决PC玩家最恶心的,高性能PCIe SSD对于游戏没有作用的尴尬。

 

第四是:秘密武器SFS技术,英文全名叫Sampler Feedback Streaming,中文名称叫采样器反馈传输技术。 就是前段时间微软公开的 DirectX 12 Ultimate 的四大核心技术之一。SFS允许开发者只把游戏需要的材质载入内存,而不需要的完全不去调用,这也极大的节省了SSD传输带宽需求,同时也变相提高了内存实际可用率。这项技术,算是黑科技中的黑科技了。

 

下面分别针对这四大部分,详细解释微软XboxSeriesX的黑科技Xbox Velocity架构。

 

第一,XSX和PS5的SSD有诸多不同

 

I/O速度在传统的PC架构和游戏机架构当中,被认为只影响应用程序的加载速度。也就是说游戏的打开速度,还有游戏切换场景的速度。但是PS5原生高达5.5GB/秒的传输速度,被有些人散播能够提升游戏的画质,甚至是一些游戏不能在PC和Xbox上运行。我们必须要强调,PS5的这个磁盘传输的速度,并不新奇。其实这个速度甚至比不过PC上一些PCIe 4.0x4的SSD。

2019年旗舰的M.2接口的SSD采用的是PCIe 3.0x4传输带宽,理论速率是4GB/s,PCIe通道是可以双向,那能达到8GB/s。但是PCIe 3.0 SSD实际的读写在3GB/s上下徘徊,这几乎是极限速度。而2020年,则全面进化到PCIe 4.0接口的SSD了。如果单纯说游戏机的SSD速度超过了PC,那就有点扯淡了。PCIe 4.0的速度就碾压游戏机了,更不要提往后5.0的标准。

 

下面我们回到正题,在之前Austin和EuroGamer对XSX进行实机技术解析是,明确提到了XSX支持PCIe4.0,也支持通过PCIe4.0扩展存储。再加上之前有媒体泄露,群联是微软的供应商,以及群联离职员工承认自己为XSX整合平价型PS5019-E19T主控。查询群联的网站我们可以知道,这款主控速写速度并不高。微软虽然采用了PCIe4.0 传输接口的SSD,但是他们用了群联的支持无缓存设计的主控来降低成本。由于采用了平价型无缓存的主控,那么微软的SSD有很大的可能性是采用了TLC闪存颗粒,就非常类似于西部数据SN550的方案。

 

而索尼的PS5则非常有可能采用了大家熟知的PS5016-E16,这款主控也是群联和AMD联合研发的第一款PCIe 4.0的主控。2019年上市的PCIe4.0的SSD,几乎都用的这款主控。三星的PCIe4.0主控上市较晚,不太可能被用于PS5。索尼作为日本企业,考虑性价比等因素,跟台湾企业合作的可能性更大。PS5的SSD对外宣传的速度,跟这块主控也一样。这块主控比XSX的主控速度更快,成本也更高,而且也支持SLC动态缓存技术。索尼官方披露PS5低配版只有825GB的可用容量,而我们知道采用了QLC闪存颗粒的固态硬盘,由于闪存密度较大,容量往往更大。这个时候就可以通过牺牲硬盘本身的一部分容量,以SLC模式运行作为缓存给SSD再提速。那么PS5的SSD方案非常有可能,采用了群联的中端主控,和比较垃圾的QLC闪存颗粒,划出了200GB的磁盘空间作为动态缓存。

 

第二:PC游戏这次拖了游戏机的后腿

 

Intel目前的CPU和主板,暂时还不支持PCIe 4.0的SSD。而小部分AMD的CPU和主板已经支持了PCIe 4.0的SSD。AMD的Zen2架构CPU支持PCIe 4.0的SSD用于次世代的游戏机,而索尼和索尼也都选择PCIe 4.0接口,只是在SSD的主控和闪存颗粒上存在不同。索尼选择了12通道的激进方案,而微软为了平衡成本和寿命选择了更低成本的4通道方案。毫无疑问,PCIe 4.0的接口速度理论传输速度要比PC目前主流的PCIe 3.0的SSD速度快很多。

 

但是,对于PC游戏来说现阶段不管哪种接口都没有任何意义。因为几乎不可能有任何游戏公司会专门针对PCIe 4.0的SSD开发游戏,要知道PC上的SSD那是千奇百怪,甚至很多人还在用SATA接口的SSD,质量好的速度也仅仅只有550MB/s。第三方游戏如果需要上PC,那就必须按照550MB/s的最大速度开发游戏,连PCIe 3.0的速度都用不上,更不要说PCIe 4.0的SSD。

 

在这一时代,不管是XSX还是PS5,游戏的磁盘传输速度都要远远要领先于PC游戏。PC没有在技术上落后,但是PC游戏确成为了那个拖后腿的人。哪怕是采用了最强的PCIe 4.0接口SSD的PC,他的游戏传输速度甚至可能都要低于次世代的游戏机。更不要说次世代游戏机不仅仅采用了高速PCIe接口的SSD,还普遍都拥有硬件级别的解压缩技术,使的磁盘I/O速度更快。

 

另外,PC的SSD主控普遍都不具备硬件解压缩技术,只有较少数的SSD的主控芯片具备这一能力。就算PC购买了带有硬件解压缩的SSD,对游戏提升帮助基本没有。所以很多PC的SSD也就不带硬件解压缩了,对应用的提升实际帮助不大,还平白拉高了成本进而影响销量。

 

第三:带有硬件解压缩的SSD的优势和劣势

 

我在上文提到了,硬件解压缩对PC来说帮助不大,PCIe的高速SSD对应用程序的性能增强几乎没用,绝大多数场景下跟SATA接口的SSD表现一致。特别是对游戏来说,看不到游戏公司针对PC游戏进行优化的可能性。但是游戏机采用硬件解压缩还是有自己的独特优势的:

 

1,SSD的性能大幅提升,显著提高游戏加载速度和场景切换速度;

 

2,提升闪存的寿命;

 

缺点也比较明显,对SSD闪存的品质要求较高,整体方案成本高,导致游戏机价格上涨。

 

第四:SSD提升画质纯属科幻吗?

 

SSD只影响磁盘的I/O传输速度,而且这种差距都是在毫秒级别的。PCIe 4.0和PCIe 3.0的差距,实际体验中几乎已经感知不到了。在XSX之前的游戏实机演示过程中已经演示过,正在运行的多个大型游戏,实现了秒切换游戏进程的效果。SSD对于游戏加载速度和切换速度的提升,是最为明显和直接的。

 

至于虚幻引擎5在PS5上的那段演示Demo,确实看的激动人心。但是事后已经证明了,笔记本都能跑,而且帧数比PS5还高。。。

 

PS5和XSX的第三方游戏开发商,几乎都不太可能充分利用到次世代游戏机的高速SSD。那么只有像微软和索尼这样的第一方游戏工作室,才有可能更加充分的利用到高速磁盘I/O来制作游戏的场景。至于两家公司的第一方工作室,能不能利用起这个优势,开发出真的PC无法实现的游戏场景,目前还只是一个传说。在没有见到实际游戏画面之前,怎么吹那都是吹。更不要说,次世代游戏机还没有上市,而PC已经正在普及PCIe4.0的更高速得SSD呢。

 

传统意义上讲,SSD速度对于画质的提升纯属科幻,那是CPU和显卡的工作。但是,最后我要强调一点:次世代游戏机不管是PS5还是XSX,都能够把一定数量的SSD磁盘当作内存来管理。这个看上去就是虚拟内存的技术,在SSD速度足够快的情况下,等于变相提高了内存的数量。

但是实际上,已经有无数的测试告诉我们,内存数量从16GB提高到32GB,对于游戏的帧数没有任何影响。当然,双通道内存还是有用的。

 

微软次世代的XboxSeriesX不仅仅,能够把SSD当作内存来管理,而且还有SFS这样黑科技中的黑科技,将内存实际可用量提高2到3倍,甚至更多。所以,对于XboxSeriesX来说,内存几乎就是用不完的。有一些媒体故意炒作XSX只有13.5GB的有效内存,业余的就跟小学生一样。

 

第五:SSD的闪存颗粒不同,可能是PS5和XSX的SSD另一大主要区别

 

下面是次世代主机官方们公布的SSD磁盘数据:

XSX:1TB PCIe 3.0接口 内置定制化 NMVe SSD,最大读写速度2.4GB/s (原生),4.8GB/s (压缩)。可扩展定制化1TB,性能与内置相同。

PS5:825GB PCIe 4.0接口 内置定制化 NMVe SSD,最大读写速度5.5GB/s(原生),9GB/s(压缩)。可扩展,容量和性能有待兼容性测试。

 

乍看之下,你会觉得PS5的固态硬盘在速度上碾压了XSX,牛到爆炸。实际上我们回到现实之中,就会发现事情没那么简单。首先1TB的QLC闪存颗粒PCIe4.0接口SSD,有一款经典的产品就是Intel无缓存的660P。这款SSD,哪怕是512GB的产品都要卖到近500元,假如有1TB版本售价肯定在200美元,约1400元人民币以上了。还有一款经典的PCIe4.0接口的SSD,采用了TLC闪存颗粒就是美商海盗船MP600 1TB版本的售价是2399元人民币,一款SSD就超过了300美金。那么PS5的PCIe4.0接口超高速的SSD,只有一种可能那就是采用了被戏称为缓存外速度跟机械硬盘类似的QLC闪存颗粒的1TB PCIe4.0接口的SSD。

Sabrent公司就用跟PS5可能同样主控的并且是QLC闪存颗粒的SSD,名称叫 1TB Rocket Nvme PCIe 4.0 M.2 2280 Internal SSD Solid State Drive (SB-ROCKET-NVMe4-1TB) ,官网售价229.9美元,这个价格比较靠谱,跟PS5内置的SSD高度相似。让人感觉到恐怖的是,不管是有在卖这款SSD的亚马逊中国,还是Sabrent自己的官方网站,都不敢标明这款SSD的TBW,使用寿命未知。

相对来说XSX的1TB PCIe4.0接口的硬盘可能就要便宜多了,比如性能最好的用料最扎实最大读写速度高达3.5GB/s的三星970EVO Plus,1TB的版本TLC闪存颗粒的SSD只卖1349元人民币,不到200美元。同样是最大读写速度2.4GB/s的西部数据TLC闪存颗粒1TB PCIe3.0接口的SN550,售价则低到了899元人民币,估计批发价也就100美元左右。

Intel 660P的512GB版本的寿命是100TBW,这个825GB版本的我们算他200TBW好了,而西部数据SN550 1TB版本有600TBW。也就是说以此为参考,XSX的SSD寿命将是PS5的整整3倍。

 

就拿闪存颗粒更好的西部数据SN550来说,西部数据也只敢给5年质保。那么用垃圾QLC闪存颗粒的PS5所谓的超高速SSD,你觉得能坚持多久不开始疯狂掉速呢?

最后我们总结一下的是,PS5可能采用了PCIe 4.0接口的QLC闪存颗粒的垃圾固态硬盘,具体性能指标百度或者谷歌Intel 660P。XSX采用了PCIe 3.0接口的TLC闪存颗粒的目前PC主流固态硬盘,具体性能指标百度或者谷歌西部数据 SN550。最后我们要补充一下,PS5如果首发的话尽量买2TB的版本,因为寿命比那个825GB的要高一倍,阿弥托福。

 

第六:PS5宣传的磁盘速度可能是假的

 

由于闪存颗粒的问题,PS5最大读写速度5.5GB/s(原生),这个数据可能是忽悠人的。上面我们已经说了,这个速度是缓存没写满时的理论最大速度。跟SN550这种全程不会掉速的固态硬盘相比,PS5只能通过限制游戏的大小不能超过200GB,来保证速度不会下降到跟U盘一样。

 

我不知道Epic的那位大佬,吹这个假速度,到底是何用意。PS5的真实磁盘速度,非常有可能没有XSX高。哪怕是原生的读写速度,更不要提压缩算法了。

 

而微软XSX的固态硬盘,则不存在这个问题。原生2.4GB的速度,全程不会掉速。这也是很多UP主为什么会推荐西部数据SN550,甚至更高型号的SN750的原因。

 

退一万步讲,如果PS5采用了TLC颗粒的PCIe4.0的固态硬盘,他将比XSX贵200美元。但是,99%的PS5游戏不能利用到这个磁盘的速度,你们觉得索尼会这么傻吗?那么真实的情况就是PS5的SSD,跟XSX的SSD价格相差不大。但是PS5的磁盘速度是假的缓存外速度,而XSX是真实地磁盘速度。

 

第七:微软为游戏纹理材质开发了专用的压缩算法,拥有碾压PS5的极大优势

 

次世代游戏机SSD全部具有硬件加速的I/O能力,而解压缩算法的不同则是他们的另一大区别。按照索尼在发布会时的官方说法,PS5采用了通用的Kraken算法。而微软则研发了全新的专门针对游戏材质BCPack算法。下面重点聊一聊压缩算法的区别:

Xbox One和PlayStation 4时代,采用的都是业界主流的Zlib压缩算法。而索尼的PS5则采用了较新的Kraken算法,是比Zlib更新一点的通用算法, 相对Zlib能提高10%的压缩效率。

针对游戏纹理材质,微软的专用算法解压缩效率更高。根据推特上技术人员的数据,微软的游戏专用算法能带来50%的磁盘I/O性能提升。而从索尼不断地采用别人的算法来看,他似乎没有能力单独为游戏纹理材质开发专用算法。

而微软公司负责优化改进 Xbox Texture Compressor(XBTC)的图形优化研究员和引擎架构师 James Stanard则在推特上这样表述: 如果索尼没有更好的算法,他认为微软将有极大的优势,在每秒能传输多少压缩材质进入内存上领先。

 

那么加上专用算法带来的性能提升,微软XSX的原生磁盘性能大概是3.6GB/s,而压缩后的性能在7.5GB/s。PCIe 3.0接口依然能满足,磁盘的最大速度。微软为什么没有采用PCIe 4.0接口的固态硬盘,就很好理解了。QLC太垃圾,微软不想用这种闪存颗粒坑害消费者。而更希望通过技术创新,研发新的压缩算法来提高SSD的性能。同时用较低的价格,选用了比QLC好太多的TLC闪存颗粒。而PS5的预期寿命不足,降速问题突出。索尼敢不敢开发能够将SSD速度跑满的所谓独占游戏,我是要打一个大大的问号的。

 

总结一下:微软通过技术创新研发新的压缩算法,将TLC闪存颗粒的平价级主控的SSD,速度提升到甚至可能超过PS5中端主控的固态硬盘,在价格接近的情况下将游戏机的寿命提高至PS5的三倍。PS5无光驱版本,需要更加频繁的写入数据到SSD,寿命会较有光驱版本更低。那么结论来了,首发买PS5尽量要买有光驱的2TB的版本。

 

第八: 微软专门为游戏而设计的全新的I/O系统DirectStorage

 

DirectStorage是一个全新的I / O系统,专门为游戏而设计,以释放SSD的全部性能和硬件解压缩。它是组成Xbox Velocity架构的组件之一。现代游戏会在后台执行资产流传输,以在您玩游戏时连续加载世界的下一部分,DirectStorage可以将这些I / O操作的CPU开销从多个核心减少到仅占单个核心的一小部分;从而释放出大量的CPU能力,使游戏可以花在更好的物理效果或场景中更多的NPC等领域。Xbox Series X引入了DirectX家族的最新成员,而且微软也计划将其引入Windows。

 

以上的内容来自微软的官方网站,很好的解释了什么是DirectStorage。最令人兴奋的是,这种比较底层的I/O技术,完全有可能已经集成到DX12的指令处理器。如果是这样,那么所有第三方开发的游戏,将会默认启动这个人类游戏历史上可能最屌的I/O系统。不管是微软第一方XSX游戏,老的天蝎座游戏,第三方游戏,全部能够默认享受到秒开游戏的极速快感。

 

跟PS5吹嘘的只能PS5第一方独占才能利用的超高速SSD不同,微软的技术是默认全部通用的,这种感知太TMD的强烈了。而且由于有硬件加速,这种磁盘I/O的速度,可以说快到令人发指。我丝毫不觉得PS5的实际磁盘I/O性能,能超过XSX,不信我们等着看游戏的实机测试吧。

 

第九:索尼PS5独不占支持DirectStorage技术的游戏

 

由于微软计划把这项技术迁移到Windows上,那么为XSX开发的游戏,理论上也能适用于所有安装了PCIe传输接口的PC电脑上。那么就会存在一种情况,某些为Xbox开发的第三方游戏,只能在主流PC和Xbox享受到超高速SSD带来的性能提升上。否则,这些第三方厂商就需要为PS5修改大量的代码了。你像育碧和光荣这种技术拉稀,又死活不肯给游戏机做优化的公司,你指望他给PS5做优化,哈哈简直是不可能。

 

由于保证XSX游戏直接移植到PC上的便利性和可能性,XSX采用了目前主流的PCIe传输接口的SSD,也是为了最大限度地保证新I/O技术的适用范围。同时还能保证游戏机的使用寿命,微软的技术选型可谓考虑的十分的周到,完全是有实力的技术公司的体现。真是这种处处负责的态度,让微软的技术适用范围更广,导致可能出现PS5独不占支持DirectStorage技术的游戏的情况发生。

 

第十:神秘的黑科技采样器反馈传输技术SFS能将可用内存和SSD性能提升2倍到3倍

 

Xbox Velocity架构的一部分,SFS是Xbox Series X硬件的一项功能,该功能允许游戏以精细的粒度仅将GPU场景所需的部分纹理加载到内存中,根据需要。这样可以大大提高纹理的内存利用率,这非常重要,因为每个4K纹理都占用8MB的内存。因为它避免了将不需要的纹理部分加载到内存中的浪费,所以它是物理内存量和SSD性能的有效2倍或3倍(或更高)乘数。这一段,也来自微软的官方网站。

 

由于减少了不需要的纹理加载。第一方大量采用SFS的技术的游戏,可以将物理内存量和SSD的速度,提升2倍道3倍。给与游戏开发者更高的权限,去更细粒度的控制纹理的传输。

我的看法是,这个黑科技太TMD的超前了。我感觉第三方的开发人员,应该都不会去看这部分的文档,你让PC游戏开发者和PS5游戏开发者怎么活?这项黑科技如果被行业广泛使用,简直不敢想象。可惜的是,这种黑科技真的只有像微软,R星,CD Projekt,欧美大的游戏公司才有可能用到了。

 

如果游戏开发的引擎,针对SFS做优化,在编译阶段自动计算重复的纹理,然后给他做标记。。。 把每个4K纹理全部去重传输,加载到内存再使用引用计数,减少内存占用。我的妈啊,这项技术将彻彻底底的改变人类整个游戏行业。 不管以后8K游戏的8K游戏纹理,还是16K的游戏纹理,全部受益。。。这又是奠定王座的黑科技。

 

将内存可用量和SSD的速度,再前面的基础上再提高2到3倍,甚至更高。SSD的速度突破PCIe4.0的极限?Epic的引擎,敢不敢支持下这个技术?我只能说,如果有游戏真的大量采用了SFS技术,这个游戏展现出来的游戏体验,必将会吓死人,吓死人,吓死人。这当真是领先整个游戏行业几十年的黑科技,直接把游戏行业的档次抬高一级。而且完全掌握SFS开发团队,可能不止把可用内存和SSD的性能提升2到3倍,恐怕能上升到5到10倍的数量级。这个技术必将深远的影响,整个游戏行业。

 

我的总结

 

这篇文章写了一天了,从2020年6月22号上午开始写,写到了晚上12点多了。越了解Xbox Velocity架构,越觉得吓人。这是真正世界顶尖的游戏公司的技术,这也是真正推动游戏行业发展的负责任的游戏公司的黑科技。Xbox Velocity架构是不亚于硬件加速的DX12指令处理器的,看上去更这个时代都不匹配的真正的游戏行业带来巨大变革的黑科技。

 

相对来说,SSD的速度,都不那么重要了。DX12指令处理器大概将AMD的SoC浮点效率提升了1倍。Xbox Velocity架构将PCIe 4.0的的速度,提高了好多倍,好多倍,好多倍。甚至有可能会达到甚至超过了PCIe 4.0接口的速度。在越了解这项黑科技之后,我越来越能理解为什么PS5的架构师要牺牲PS5的寿命,也要强行上中端SSD主控。因为微软不可思议的把平价级群联主控的SSD磁盘性能拉到了中端主控甚至高端主控的级别,这真的是黑科技中的黑科技。PS5的架构师,应该比我更了解Xbox Velocity架构的威力,所以他才会看似愚蠢的强行上QLC闪存颗粒的SSD。真的是没办法,技术实力差别太大了。

 

我能在这个时代见证游戏机历史上这样的黑科技,我真的感觉到很恐怖。那种几十年全球人才汇聚和技术积累,才能实现的黑科技,竟然这么快就发生了。当我还在感叹DX12指令处理器有多牛逼的时候,Xbox Velocity架构把我吓傻了。更可怕的是,微软XboxSeriesX不仅仅只有这个,他还有更多的黑科技等待我们去揭秘。

 

引用列表:

Defining the Next Generation: An Xbox Series X Technology Glossary  https://news.xbox.com/en-us/2020/03/16/xbox-series-x-glossary/

由於微軟採用全新 Xbox Velocity 架構,專屬遊戲僅能安裝在內部 SSD 與 Storage Expansion Card  https://www.cool3c.com/article/152480

微软研究员发推称:XSX 使用全新压缩算法较 PS5 更优越  https://ngabbs.com/read.php?tid=20919781

群联官方网站关于PS5019-E19T主控的介绍  https://www.phison.com/en/technologies-gen4/pcie-gen4-awareness/1150-ps5019-e19t

群联官方网站关于PS5016-E16主控的介绍 https://www.phison.com/en/technologies-gen4/pcie-gen4-awareness/1149-ps5016-e16

群联官方网站关于PS5018-E18主控的介绍 https://www.phison.com/en/technologies-gen4/pcie-gen4-awareness/1151-ps5018-e18

帖子投票

名称 是否有价值
kideny
BigLoser
XboxSeriesX群组的头像

XboxSeriesX

XboxSeriesX讨论群组,官方QQ群464318214。

投票统计

内容是否原创:100%

100% Complete (success)

内容是否有价值:100%

100% Complete

内容是否有素质:100%

100% Complete (warning)

内容是否合法:100%

100% Complete