元素6:持续性的挑战,我们很难记录自己的所有“足迹”

早些时候,我们讨论了虚拟世界中“持续性”的概念。目前几乎没有一款游戏表现出完全的持续性。相反,它们在重置部分或全部虚拟世界之前,只运行了有限的一段时间。以热门游戏《堡垒之夜》和《自由之火》( Free Fire)为例。在整个比赛过程中,玩家建造或摧毁各种建筑,放火烧毁森林,或猎捕野生动物,但在20~25分钟后,地图有效地“结束”,并被Epic Games和Garena公司删除数据,永远不会被玩家重新体验,即使他们保留了在该比赛中赢得或解锁的物品。实际上,即使在一场特定的比赛中,虚拟世界也会删除一些数据,例如不可摧毁的岩石上的弹痕,它可能在30秒后被“清除”,以减少渲染的复杂性。

并非所有虚拟世界都像《堡垒之夜》中的比赛那样可以重置。例如,《魔兽世界》是持续运行的。然而,如果说它的虚拟世界是完全持续性的,仍然是错误的。如果玩家进入《魔兽世界》中地图的一个特定区域,击杀敌人后离开,当返回时,他们往往会发现那些敌人已经重生了。如果游戏中的商人在一天前才向玩家出售了一件稀有道具,那么第二天,他可能会向玩家提供第二件道具,就好像这是他们的第一件道具一样。只有当开发者(动视暴雪公司)进行了大规模的更新后,虚拟世界才会发生变化。玩家自己不能影响一个特定的选择或事件的后果是否会无限期地持续下去。唯一能够留存下来的是玩家的记忆,以及他们击败敌人或购买物品的记录。

虚拟世界中的持续性的挑战可能有点难以把握,因为我们在现实世界中并不会遇到这个问题。如果你在现实中砍了一棵树,它就消失了,不管你自己是否记得砍了它。而对于一棵虚拟的树,你的设备和管理它的服务器必须主动决定是否保留这些信息,渲染它,并与他人共享场景。如果选择这样做,还有更多的细节问题需要考虑:这棵树只是“消失了”,还是被砍倒在地?玩家需要看到它是从哪一边被砍倒的,还是只要看到它被砍倒后的样子?它是否会被“生物降解”?如果是的话,情况又会是怎样的?在一般情况下,它又会对当地环境做出怎样的反应?你应该意识到, 可持续性信息越多,计算需求就越大,可用于其他活动的内存和计算资源就越少。

《星战前夜》,一个持续存在的虚拟奇迹

计算-持续性相互作用的最佳例子就是游戏《星战前夜》( EVE Online)。虽然没有像21世纪初的其他原生代元宇宙,比如《第二人生》或Roblox这样的新游戏或游戏平台那样出名,但《星战前夜》确实是一个奇迹。除了偶尔因排除故障和更新而停机之外,《星战前夜》自2003年推出以来一直持续不断地运行。与《堡垒之夜》等游戏不同的是,《星战前夜》并没有将数千万玩家置于持续时间为20~30分钟的12~150人比赛中,而是将其每月数十万的用户置于一个单一的、共享的虚拟世界中,该虚拟世界涵盖了近8 000个星系和近70 000颗行星。

《星战前夜》非凡的虚拟世界依托一个创新的系统架构,而且主要是出色的创意设计。

《星战前夜》的虚拟世界本质上只是空荡荡的3D空间,壁纸背景看起来像一个星系。用户无法真正地访问一个星球,采矿等活动更类似于设置无线路由器,而不是建造一个虚拟平台。因此,游戏的持续性主要表现为管理一套相对适度的权利(如玩家的飞船和资源)和相关的位置数据。这意味着这款游戏的发行商CCP游戏公司的服务器和用户的计算工作较少,他们的设备不需要渲染一个发生了改变的世界,只需要渲染其中的一些物体。还记得吗?复杂性是实时渲染的劲敌。

此外,在《星战前夜》中,每天、每季度甚至每年发生的事情都很少。这是因为《星战前夜》的目标,就其存在的程度而言,是让各派玩家征服行星、星团和星系。这主要是通过建立公司、形成联盟,以及制定舰队的战略来实现的。为此,《星战前夜》的大部分活动实际上是在现实世界中通过第三方信息应用和电子邮件进行的,而不是在CCP游戏公司的服务器上进行的。玩家花了数年时间来策划攻击方案,在敌方公会中做卧底,以便伺机而动,并建立巨大的个人网络来交易资源和建造新的飞船。虽然大规模的战斗确实会发生,但这种情况非常罕见,而且战斗只会破坏虚拟世界中的资产(如飞船),而不是虚拟世界本身。对处理器来说,管理虚拟世界中的资产比管理虚拟世界本身容易得多,就像把花园里的杂草扔进垃圾桶比了解它会对花园生态系统产生怎样的影响要容易得多。

《星战前夜》之所以成为一个特别的例子,是因为从技术层面和社会学层面来说,它是非常复杂的,但同时,与大多数人对元宇宙的设想相比,它又非常有限。在斯蒂芬森的《雪崩》中,元宇宙是一个行星大小、细节丰富的虚拟世界,有几乎无限多的独特商业场所、可参观的地方、可从事的活动、可购买的东西和能够遇见的人。几乎任何用户在任何时候所做的任何事情都可以持续存在。这一原则不仅适用于虚拟世界,也适用于其中的单个物体。我们的化身身上会留下岁月痕迹,我们的虚拟运动鞋穿久了会磨损。而且根据互操作性原则,无论我们走到哪里,这些变化都会持续存在。为了创造和维持这种体验,必须读取、写入、同步化(下文将详细介绍)和渲染的数据量不仅是前所未有的,而且远远超出了今天的处理能力。然而,斯蒂芬森在小说中描绘的元宇宙很有可能并不理想。他的构想是人们在元宇宙虚拟的家中醒来,然后步行或乘火车到一个虚拟酒吧。虽然拟物化(skeuomorphism)操作通常具有实用性,但其中的“主街”作为虚拟世界中一切事物的单个统一层,可能并不实用。元宇宙中的大多数参与者宁愿从一个目的地被传送到另一个目的地。

幸好,管理一个用户的数据(比如,他们拥有的物品和所做的事情)在不同世界和时间上的持续性,比管理每个用户在一个行星大小的世界中做出哪怕最微小改变的持续性,要容易得多。这种模式也更能反映今天的互联网的特点,这可能也是我们喜欢的交互模式。在网络上,我们经常直接导航到一个网页,例如谷歌文档中的某个文件或YouTube上的一个视频。而不会从某个互联网主页开始,然后点击访问谷歌,最后再导航到相应的页面。

此外,互联网的存在与任何一个网站、平台或顶级域名(如.com)无关。如果一个网站甚至许多网站不再存在,上面的内容可能会丢失,但互联网作为一个整体将持续存在。用户的许多数据,如浏览痕迹(cookies)或IP地址,都可以在没有特定网站、浏览器、设备、平台或服务的情况下存在,更不用说他们创造的内容了。然而,如果一个虚拟世界下线、重置或关闭,对玩家来说,里面的一切就都不存在了。即使这个虚拟世界继续运作,但当玩家停止在这里玩游戏时,他们拥有的虚拟商品、历史记录和取得的成就,甚至他们的部分社交图谱都可能丢失。当虚拟世界本身只是以游戏为目的时,这个问题并不严重。但对于人类社会而言,如果转移到虚拟空间是为了实现某些意图,比如为了教育、工作、医疗,我们在这些空间所做的事情必须可靠地持续下去,就像我们的小学成绩单和棒球奖杯那样。包括约翰·洛克(John Locke)在内的哲学家认为,身份是记忆的延续。如果是这样,那么只要我们所做的和曾经做过的一切都被遗忘了,我们就永远不可能有一个虚拟的身份。

在单个虚拟世界中增加持续性,对于元宇宙的发展至关重要。我将在本书接下来的章节中介绍,在过去5年中流行起来的许多设计理念并不是新的,而是提出了新的可能性。因此,我们目前可能很难弄清楚为什么《魔兽世界》需要永远确切地标记用户在刚刚下过雪的雪地上踩出的脚印,但有可能一些设计师最终会找出答案,不久之后,持续性将成为许多游戏的核心特性。在那之前,最需要持续性的虚拟世界可能是那些围绕虚拟房地产建立的虚拟世界,或者与物理空间相联系的虚拟世界。例如,我们希望数字孪生经常更新,以反映它们在现实世界中的对应事物的变化,而且纯虚拟的房地产平台不会“抹去”样板间中的装饰物。

元素7:同步性,实时共享或虚拟死亡

我们希望元宇宙中的虚拟世界并不只是持续存在或实时回应我们,而是能成为共享的体验。要做到这一点,虚拟世界的每个参与者都必须有一个能够在特定时间内传输大量数据的互联网连接(高带宽),以及一个低延迟(快速)、持续性(持续、不间断)的虚拟世界服务器(包括进出)连接。

这看起来好像并不是一个无法满足的要求。毕竟,数以千万计的家庭此刻可能正在播放高清视频,而在整个新型冠状病毒肺炎疫情大流行期间,全球经济体系在很大程度上是通过实时和同步的视频会议软件得以维持的。随着互联网中断的情况越来越少,宽带供应商也在继续吹嘘并做出带宽和延迟方面的改进。

然而,同步在线体验可能是当今元宇宙面临的最大限制,也是最难解决的一个问题。简单来说,互联网不是为同步共享体验而设计的,而是为了能将一方的消息和文件的静态副本与另一方共享而设计的。这里的另一方是指那些不断访问这些内容的研究实验室和大学。虽然这听起来是不可思议的限制,但今天几乎所有的在线体验都面临这样的限制,具体的原因是,几乎没有人需要连续性连接来感受生活,或者说,没有人需要这种连续性!

当用户认为他们正在浏览一个实时网页,例如不断更新的Facebook新闻消息或《纽约时报》的实时选举消息时,他们实际上只是在“冲浪”更新频率很高的页面。实际发生的情况是这样的:首先,用户的设备通过浏览器或应用程序向Facebook或《纽约时报》的服务器发出请求;接下来,服务器处理该请求,并返回适当的内容。这些内容包括按给定的时间间隔(比如,每5秒或每60秒)向服务器请求更新的代码。此外,这些来自用户的设备或相关服务器的传输内容,都可能经过不同的网络到达接收者的设备。虽然这感觉像是一个实时的、连续的和双向的连接,但它实际上只是成批的单向、经过不同路由的非实时数据包。我们所说的“即时通信”应用程序也采用同样的模式。用户和他们之间的服务器,实际上只是互相推送固定的数据,同时以较高频率对信息请求进行响应,即发送消息或发送阅读回执。

就连奈飞采用的也是这种非连续性机制,尽管“流媒体”一词和目标体验——不间断播放似乎表明情况并非如此。事实上,该公司的服务器一直向用户发送不同批次的数据,其中许多数据从服务器传输到用户端要经过不同的网络路径。奈飞甚至经常在用户需要内容之前就已将内容推送给了他们,比如额外推送30秒的内容。

如果发生暂时性传输错误,例如,某条路径拥堵,或者用户暂时无法连接Wi-Fi,视频将继续播放。奈飞采用的这种非连续性机制会让用户感觉视频是连续播放的,但这只是因为它采用非连续性方式返回了内容。

奈飞也有其他招数。例如,该公司在向观众开放视频权限之前的几个月到几小时内都会收到这些视频文件。这给了该公司一个窗口,在此期间,它可以进行大量基于机器学习的分析,从而能够通过分析帧数据来确定哪些信息可以被删除,从而“压缩”文件。比如,该公司的算法在“观察”一个有蓝天的场景时决定,如果用户的网络带宽突然下降,就将500种不同的蓝色简化为200种、50种或25种。流媒体平台的分析甚至可以根据上下文来执行相应的算法,比如对话场景可以比那些节奏更快的动作场景更适合压缩。此外,奈飞还会在本地节点上预加载内容。当你要求看最新一集的《怪奇物语》( Stranger Things)时,这部分内容实际上距离你只有几个街区,因此马上就能出现在你眼前。

上述方法之所以有效,是因为奈飞提供的是一种非同步的体验;你不能为正在制作的实时内容“预先做任何事”。这就是为什么美国有线电视新闻网(CNN)或Twitch的现场视频流,可靠性会远远低于奈飞或HBO Max的点播流。但即使是直播平台也有自己的技巧。例如,传输通常会延迟2~30秒,这意味着在暂时出现网络拥堵的情况下,平台仍有机会预先发送内容。内容提供者的服务器或用户也可以通过插播广告的方法,在发现之前的服务器不可靠的情况下重置连接。大多数实时视频只需要一个单向的连续性连接,比如,从CNN的服务器到用户端的连接。有时,实时视频需要双向连接,如用Twitch聊天时,但在这种情况下,用户共享的只是极少量的数据,也就是聊天本身的数据,这并不重要,因为它不会直接影响视频的播放。记住,实际上这些事情可能发生在2~30秒之前。

总的来说,除了实时渲染的多用户虚拟世界之外,很少有在线体验需要高带宽、低延迟和连续性连接。大多数体验只需要上述三项要求中的一个或最多两个得到满足即可。高频股票交易员,尤其是高频交易算法,希望交易能在尽可能短的时间内完成,因为这可能关系到买入或卖出证券对应的利润或损失。然而,订单本身是基本的和轻量级的,不需要连续性服务器连接。

Zoom、Google Meet或Microsoft Teams等视频会议软件例外。在使用这些软件时,许多人同时接收和发送高分辨率视频文件,并参与到一个共享的体验中。然而,这些体验只有通过软件解决方案才能实现,对于有许多参与者需要实时渲染的虚拟世界来说,并不真正可行。

回想一下你上次使用Zoom进行视频会议时的情形。时不时地,有几个数据包可能到达得太晚,或者根本没有发送过来,这意味着有一两个字你没有听到,或者你的一些话没有被视频会议中的其他人听到。尽管如此,你和其他参加视频会议的人仍能理解发言者所讲的内容,通话可以继续。如果你的连接暂时中断,但很快又恢复了,Zoom可以把你错过的数据包重新发送给你,然后加快回放速度,并删除停顿,以便“赶上”你的进度去呈现“实时性”。你的连接有可能完全中断,这要么是由于你的本地网络出现了问题,要么是由于你的本地网络和远程Zoom服务器之间出现了问题。如果发生了这种情况,你可能会在没有人知道你离开的情况下重新加入,即使他们知道,你的缺席也不太可能引起混乱。这是因为视频会议是由一个人主导的共享体验,而不是由许多用户共同主导的共享体验。如果你是发言者呢?好消息是,在没有你的情况下,通话仍可以继续进行,要么有另一个参与者成为新的发言者,要么大家等你重新加入。如果在某一时刻,网络拥堵到你或其他人根本无法听到或看到正在发生什么的地步,Zoom将停止上传或下载通话中各成员的即时视频,以优先处理最重要的事情——音频。或者,通话可能被不同的延迟所干扰,也就是说,有的人在接收“现场直播”的视频和音频时,会比其他人晚0.25秒、0.5秒,甚至整整1秒,这就给轮流发言带来了困难并导致连续性中断。最终,你的视频会议软件可能会给出处理这个问题的方法,只是需要一点耐心。

虚拟世界对性能有着更高的要求,甚至比视频通话更容易受到哪怕是最轻微的连接中断等故障的影响。实时传输的数据集要复杂得多,而且需要及时地从所有用户那里得到数据。

与视频通话实际上有一个发起者和几个参与者不同,虚拟世界通常有许多共享参与者。因此,任何个体的数据丢失,不管丢失的时间多么短暂,都会影响集体的体验。即使一个人的数据没有完全丢失,只是与其他连接者稍微不那么同步,他也会完全丧失影响虚拟世界的能力。

想象一下玩一个第一人称射击游戏。如果玩家A落后于玩家B 75毫秒,玩家A可能会朝他认为玩家B所在的位置开枪,但玩家B和游戏服务器都知道玩家B已经离开了。这种差异意味着虚拟世界的服务器必须决定谁的体验是“真实的”,也就是说,哪些内容应该被呈现出来,并在所有参与者中持续存在,而哪些人的体验必须被拒绝。在大多数情况下,滞后的参与者的场景内容将被拒绝,以便其他参与者可以继续玩游戏。如果元宇宙中的许多人体验到的是相互矛盾的版本,也就是无效的版本,那么它就不能真正作为人类生存的平行平面而发挥作用。

每个模拟中的用户数量方面存在的计算限制往往意味着,如果一个用户从某个会话中断开连接,他可能永远无法重新加入。这不仅破坏了该用户的游戏体验,也破坏了他的朋友的游戏体验,如果他们想继续一起玩,就必须退出虚拟世界,或者在没有该用户参与的情况下继续玩。

换句话说,延迟和滞后可能会让奈飞和Zoom的个人用户感到沮丧,但在虚拟世界中,这些问题将使个人面临虚拟死亡的风险,而集体则处于持续沮丧的状态。在写作本书时,约有3/4的美国家庭可以经常进入大多数实时渲染的虚拟世界。在中东地区,只有不到1/4的家庭能做到这一点。

围绕同步性面临的挑战展开的讨论,对于理解元宇宙未来几十年的发展方向和增长趋势至关重要。尽管许多人认为元宇宙依赖于设备的创新,如VR头显、游戏引擎(如虚幻引擎)或Roblox等平台,但网络能力将在很大程度上定义并限制哪些内容是可行的、什么时候可行,以及它们面向的是哪些用户。

没有简单、廉价或快速的解决方案,我们需要新的电缆基础设施、无线标准、硬件设备,甚至可能需要对TCP/IP协议的基本元素进行大幅调整,如大幅调整边界网关协议(Board Gateway Protocol,BGP)。这一点我将在后面的章节中介绍。

大多数人都没有听说过BGP协议,但这个协议的应用非常广泛,它通过管理数据在不同网络中的传输方式和位置,扮演着数字时代交通卫士的角色。BGP协议面临的挑战在于,它最初是为在互联网上分享静态、异步文件的情况而设计的。它不知道,更不了解自己在传输什么数据,无论是电子邮件、现场演示,还是在实时渲染的模拟环境中用于躲避虚拟枪击的一组输入,也不知道传输的方向(入栈或出栈),以及遇到网络拥堵时会受到的影响等。相反,BGP协议遵循了一种相当标准化的一刀切的路由流量方法,从本质上说,它权衡了最短路径、最快路径和最经济路径(通常偏好最后一个变量)。因此,即使一个连接是连续性的,它也可能是一个不一定会被选用的路径较长的(隐藏)连接,并且可能被切断,以便对不需要实时交付的网络流量进行优先级排序。

BGP协议是由IETF管理的,可以进行修改。然而,具体能不能修改,取决于成千上万不同互联网服务提供商、私人网络、路由器制造商、内容交付网络等是否支持这项修改。可以说,即便BGP协议的内容有了实质性更新,但对于一个全球规模的元宇宙来说,也可能是不够的,至少在不久的将来是不够的。

元素8:无限用户和个体存在,让用户瞬间聚集

虽然斯蒂芬森没有给出具体时间,但《雪崩》中的各种参考资料表明,故事发生在21世纪第二个10年的后5年中。斯蒂芬森所描述的元宇宙大约是地球面积的2.5倍,在任何时候,“(元宇宙的)人口数量都是纽约市人口数量的两倍”。在斯蒂芬森虚构的“现实世界”中生活的大约80亿人中,共有1.2亿人可以使用强大的计算机来处理元宇宙的协议,并可以随时加入。但在现实世界中,我们离这样的目标还很遥远。

我们还有多远的路要走?即使是面积小于10平方千米、功能受到严重限制、由历史上最成功的游戏公司运营、在更强大的计算设备上运行的非连续性虚拟世界,仍然很难处理一个共享的模拟环境中50~150个用户的操作。更重要的是,支持150个并发用户是一项重要的成就,而能获得这样的成就只是因为这些游戏的创意设计方式。在《堡垒之夜》大逃杀模式(battle royale)中,多达100名玩家可以进入一个动画效果出众的虚拟世界,每个玩家控制一个精细的化身,可以使用十几种不同的物品,展现几十种动作,并建造几十层高的复杂建筑。然而,《堡垒之夜》的面积约为5平方千米,这意味着只有一二十个玩家会同时出现在一个场景中,而且当玩家被迫进入地图上的更小区域时,大多数玩家已经被淘汰,变成了记分牌上的数据。

同样的技术限制也影响了《堡垒之夜》的社交体验,比如2020年特拉维斯·斯科特在该平台上举办的那场著名的虚拟演唱会。在这种情况下,“玩家”聚集在地图上很小的区域内,这意味着普通设备必须渲染和计算更多信息。因此,该游戏的每个副本100名玩家的标准上限降了一半,而许多项目(比如建筑项目)和动作则被禁用,从而进一步减少了工作负荷。虽然Epic Games可以理直气壮地说,有超过1 250万人参加了这场现场演唱会,但这些参与者是在25万个不同副本中观看了这场演唱会。也就是说,他们看到的是25万个版本的斯科特,而在这些副本中,这场演唱会的开始时间竟然都不相同。

《魔兽世界》是一款“大型多人在线游戏”,它也面临着并发用户带来的挑战。要玩这款游戏,用户必须首先选择一个“领地”,选择领地就代表选择了一个独立的服务器,该服务器管理着大约1 500平方千米的虚拟世界的完整副本,在那里他们看不到其他领地的人,也不能与他们互动。从这个意义上说,将游戏称为魔兽“世界”可能更恰当。用户可以在不同的领地之间移动,从而在哲学上将这些众多的世界统一为一个“大型多人”在线游戏。每个领地的参与者上限为几百人,如果一个特定领地的用户太多,游戏就会为这个区域创建几个不同的临时副本,同时将这些用户分配到这些副本中。

尤拉问题,打响《星战前夜》历史上规模最大的一场战斗

《堡垒之夜》与《星战前夜》、《魔兽世界》等的区别在于,在《堡垒之夜》中,所有用户都是一个单一、持续存在的领地的一部分。但同样,这一切都得益于游戏的特定设计。例如,基于空间的战斗性质决定了动作的种类有限、相当简单(对比一下激光束与跳跃或跳舞的玩家),而且很少需要做出。命令一艘飞船到一个星球上开采资源,或者从一个固定位置发出的一连串爆炸,或朝一个固定位置连续扔炸弹远没有两个不同的动画化身跳舞、跳跃和相互射击那么复杂。《星战前夜》的创新之处不在于游戏的处理和渲染,而在于玩家在游戏之外的计划和决定。由于游戏场景设置在浩瀚的太空中,大多数玩家彼此相距甚远,这样一来,CCP游戏公司的服务器在通常情况下会认为这些玩家处于不同的虚拟世界。此外,该公司在游戏中使用了“旅行时间”这一创意,可以防止用户瞬间聚集到同一个位置。

即便如此,《星战前夜》还是不可避免会遇到并发性问题。在21世纪初的某个时候,一群玩家意识到尤拉(Yulai)星系位于一个较大星团内的许多高流量行星附近,因此在尤拉星系建立了一个新的交易中心。他们的判断是对的。开店后不久,许多买家开始涌向该地区,这吸引了更多卖家,然后又吸引了更多买家,如此往复。最终,该交易中心同时进行的交易数量使得CCP游戏公司的服务器开始崩溃,导致发行商改变《星战前夜》宇宙,使目的地的访问变得不那么方便。

从“尤拉问题”中得到的教训无疑能帮助CCP游戏公司在随后的几年里,设计、扩展和改造游戏地图。然而,这并没能帮助CCP游戏公司避免这样的结果:战斗突然爆发,由于这些战斗的战略意义重大,成千上万的用户为保护他们自己的阵营或击败其他阵营而迅速聚集起来。

2021年1月,《星战前夜》历史上规模最大的一场战斗打响。参与这场战斗的人数刷新了纪录,是之前最高纪录人数的两倍多。之前的那场战斗在帝国派和一个名为PAPI的敌对联盟之间展开,持续时间近7个月,场景不断升级,进入白热化。目前的这场战斗也应该会朝着白热化方向发展。唯一真正的输家是CCP游戏公司的服务器,由于无法承载一个系统中出现12 000名玩家的情况,以及有些玩家为了获得决定性胜利而大杀四方的局面,该公司的服务器陷入了瘫痪。大约一半玩家无法进入系统,而许多进入系统的玩家也饱受折磨——如果他们登录游戏,很可能还没来得及输入连贯的指令就被敌人杀死了,而死去则意味着他们的服务器位置可能会被敌人占据,这样一来他们的盟友也面临着被杀的危险。这里有一个最终的赢家——帝国,但这主要是系统默认的结果,因为在一场从未真正发生的战斗中,防御者自然会赢。

并发性是元宇宙的一个基本问题,其根本原因是:服务器在单位时间内处理、渲染和同步的数据量必须呈指数级增长,才能实现并发性。渲染一个瑰丽繁复的虚拟世界并不难,因为这与观看一段精心设计和可预测的鲁布·戈德堡机械(Rube Goldberg machine)的视频一样。并且如果玩家,或者说观众不能影响这种模拟,他们也不需要与它保持实时连接或同步。

只有当元宇宙能够支持大量用户在同一时间、同一地点体验同一事件,并且不以牺牲用户功能、世界交互性、持续性、渲染质量等为代价时,元宇宙才能真正实现。想象一下,如果任何一场体育比赛、演唱会,任何一个博物馆、学校或购物中心都只对50~150人开放,那么这个社会将会是多么不同,多么受限。

我们距离复制“真实世界”的密度和灵活性这一目标还很遥远,短时间内无法实现。2021年,在Facebook元宇宙主题演讲中,Oculus VR首席技术官约翰·卡马克沉思道:“假如有人在2000年问我,‘如果你的系统处理能力是现在的100倍,你能构建元宇宙吗……’我会说可以。”然而,22年后,即便有Facebook这家价值极高且致力于构建元宇宙的公司的支持,卡马克认为元宇宙这一愿景仍然至少需要5~10年时间才会实现,而且实现过程中必然牵涉“重大优化”权衡。尽管相比于世纪之交的数亿台个人电脑,现在的个人电脑数量已达到数十亿台,几乎是世纪之交时的10倍,但要实现这一愿景仍需要很长时间。

元宇宙不是Web3

我对元宇宙的定义为:大规模、可互操作的网络,能够实时渲染3D虚拟世界,借助大量连续性数据,如身份、历史、权利、对象、通信和支付等,可以让无限数量的用户体验实时同步和持续有效的在场感。 现在,你应该能理解我为何会给出这样的定义了。许多读者可能会惊讶地发现,这个定义以及它的子描述中都没有出现去中心化、Web3和区块链等术语。的确,读者会做出这样的反应是有原因的。近年来,这三个词已经变得无处不在,经常组合出现,并与“元宇宙”一词联系在一起。

Web3指的是一个定义模糊的未来互联网版本,它是围绕独立的开发者和用户构建起来的,并不是面向谷歌、苹果、Facebook、亚马逊和微软(这5家公司的首字母缩写为GAFAM,后文使用这一缩写形式)等笨重的聚合平台而构建的。它是当今互联网的一个更加去中心化的版本,许多人认为,区块链是实现Web3的最佳手段,至少可以借助它来实现Web3。也正因为如此,人们开始把区块链与元宇宙联系起来。

元宇宙和Web3都是我们今天所认为的互联网的“继承者”,但它们的定义截然不同。Web3没有对3D、实时渲染或同步体验提出直接要求,而元宇宙不需要去中心化、分布式数据库和区块链,也不需要在线权力或价值从平台向用户的相对转移。把这两者混在一起有点像把国家的建立与工业化或电气化混为一谈,前者牵涉社会的形成和治理,而后者涉及技术的发明和推广。然而, 元宇宙和Web3可能会同时出现。 大型技术变革通常会引发社会变革,因为它们通常赋予了个人消费者更多发言权,并催生新的公司以及个人领导者。其中许多公司正是发现了人们对现状的普遍不满才成立的,并承诺要开创一个不同的未来。如今许多公司都在关注元宇宙带来的机会——尤其是那些不走寻常路的科技和媒体初创公司,正在围绕区块链技术发展自己的公司。因此,这些公司的成功也将带动区块链技术的发展。

无论如何,Web3的原则对于建立一个蓬勃发展的元宇宙很可能是至关重要的。对大多数经济体来说,竞争有利于自身的良性发展。许多观察家认为,当前的移动互联网和计算过于集中在少数参与者手中。此外,构建元宇宙的组织不会是那些直接促成它的基础平台,就好像美国并不是由美国联邦政府建立的,欧盟也不是由欧洲议会建立的一样。元宇宙将由独立用户、开发人员和中小型企业构建,就像物理世界一样。任何希望元宇宙存在的人,乃至那些不希望它存在的人,都应该希望元宇宙的发展由这些群体来推动,而不是由大型企业来推动,这些群体也将成为元宇宙主要的受益者。

还有其他Web3方面的考虑,比如信任,这是元宇宙健康发展和实现繁荣的关键。在集中式数据库和服务器模式下,Web3的支持者认为所谓的虚拟或数字赋权只是表面现象。用户购买的虚拟帽子、土地或电影不可能真正属于他们,因为他们永远无法控制这些虚拟物品,无法从“出售”这些物品的公司的服务器上删除它们,或确保所谓的卖家不会删除、收回或更改它们。2021年,在这类虚拟平台项目上大约花费了1 000亿美元之后,中心化服务器显然不能阻止可观的用户支出。然而,由于需要依赖价值高达万亿美元的平台,这种用户支出受到了限制,因为这些平台永远将自身利益置于个人用户利益之上。比如,你会投资一辆经销商随时可以收回的汽车,还是会翻新一间政府可能无故征用或修复的房子,或者购买一件一旦升值可能会被画家立即收回的艺术品吗?答案有时候是肯定的,但不是所有人都会给出这样的答案。这种不确定性对虚拟物品开发商来说尤其成问题,他们必须建立虚拟商店、企业和品牌,但无法保证自己将来是否还可以运营它们,而且他们可能会发现要想继续运营,唯一的办法就是向虚拟房东支付双倍的租金。法律系统最终可能会更新,从而让用户和开发人员对其产品、数据和投资拥有更大的决定权。但有些人认为,有了去中心化,用户不必再依靠法令,而且这些法令本身执行起来就是低效的。

此外,中心化服务器模型是否能够支持一个几乎无限、持续、世界级规模的元宇宙?一些人认为,要想获得元宇宙所需的计算资源,只能依靠去中心化网络,去中心化网络归网络中的每一位用户所有且能令每位用户受益。这些内容可能有点超前了。

THE METAVERSE 透视元宇宙

如何理解元宇宙,影响了我们如何构建未来

元宇宙的定义是:大规模、可互操作的网络,能够实时渲染3D虚拟世界,借助大量连续性数据,如身份、历史、权利、对象、通信和支付等,可以让无限数量的用户体验实时同步和持续有效的在场感。

1.元素1:虚拟世界,完美再现现实世界。虚拟世界分为三类:第一类是完美再现现实世界,这些虚拟世界通常被称作“数字孪生”;第二类是象征现实世界的虚构版本;第三类是完全虚构的世界,人们在其中可以完成很多他们在现实世界中不可能完成的事。

2.元素2:3D,互联网的下一个伟大迈进。尽管元宇宙应该被理解为一种3D体验,但这并不意味着元宇宙内的一切都将是3D形式的。

3.元素3:实时渲染,使虚拟世界“活”起来。沉浸式3D需要比2D更强大的计算能力。尽管实时渲染可以使虚拟世界“活”起来,但这意味着每秒必须至少渲染30帧,最好是120帧。

4.元素4:互操作性,元宇宙经济将驱动统一的传输标准。元宇宙应该允许用户无论走到哪里或者选择做什么,他们的成就、历史,甚至财务状况都能在众多的虚拟世界和现实世界中得到认可。

5.元素5:大规模扩展,是虚拟世界而不是数字主题公园。如果它要成为“元宇宙”,就必须拥有大规模的虚拟世界。否则,它更像是一个数字主题公园,永远不可能像外面的真实世界那样多样化。

6.元素6:持续性的挑战,我们很难记录自己的所有“足迹”。在单个虚拟世界中增加持续性,对于元宇宙的发展至关重要。如果你在现实中砍了一棵树,它就消失了,不管你自己是否记得砍了它。而对于一棵虚拟的树,你的设备和管理它的服务器必须主动决定是否保留这些信息,渲染它,并与他人共享场景。

7.元素7:同步性,实时共享或虚拟死亡。我们希望元宇宙中的虚拟世界并不只是持续存在或实时回应我们,而是能成为共享的体验。

8.元素8:无限用户和个体存在,让用户瞬间聚集。只有当元宇宙能够支持大量用户在同一时间、同一地点体验同一事件,并且不以牺牲用户功能、世界交互性、持续性、渲染质量等为代价时,元宇宙才能真正实现。

04

元宇宙,下一代互联网

我对于元宇宙的定义应该能够为这个问题带来一些新的启发:为什么人们通常认为元宇宙是移动互联网的继承者?要想让元宇宙成为现实,需要开发新的标准,创建新的基础设施,可能还需要对长期存在的TCP/IP协议进行彻底改革,包括采用新的设备和硬件,甚至可能打破技术巨头、独立开发者和终端用户之间的权利平衡。

这一巨大转变也解释了为什么企业在预测元宇宙即将成为现实之际,纷纷重新调整自己的定位,尽管它的到来还很遥远,它带来的影响在很大程度上也无法确定。精明的商业领袖们都很清楚,每当一个新的计算和网络平台出现时,整个世界和这些平台背后的公司的命运就会彻底改变。

在20世纪50年代至70年代的大型机时代,主流计算操作系统是“IBM和七个小矮人”,人们通常认为这七个小矮人是Burroughs、Univac、NCR、RCA、Control Data、霍尼韦尔(Honeywell)和通用电气。严格来说,个人电脑时代始于20世纪80年代,IBM及其操作系统是该时代的短暂引领者。然而,最终的赢家是新入场者,最著名的当属微软、戴尔、康柏和宏碁等制造商。微软取得成功的关键在于,它的Windows操作系统和办公软件套装几乎可以在世界上任何一台个人电脑上运行。2004年,IBM完全退出个人电脑业务,将ThinkPad系列卖给了联想。移动时代也有类似的故事上演。新的平台正在兴起或出现,即苹果的iOS系统和谷歌的安卓系统,而随着Windows式微,PC时代的制造商被小米和华为等新入场者所取代。

事实上,计算和网络平台的代际变化甚至经常扰乱最不容易改变和受保护的行业。例如,20世纪90年代,AIM即时通(American Online Instant Messenger)和ICQ等聊天服务迅速建立了基于文本的通信平台,这两个平台的用户数量和使用量可以媲美许多电话公司甚至邮政服务。21世纪初,这些服务被Skype等提供实时音频的软件所超越,Skype也能连接到传统电话系统和离线电话系统。移动时代,出现了一批新的引领者,如WhatsApp、Snapchat和Slack,它们不仅能提供类似于Skype的服务,而且致力于制造移动设备。

这些新的引领者根据不同的使用行为、需求,甚至是不同的沟通风格来构建服务。比如,WhatsApp几乎是为持续使用而设计的,而不是像Skype那样为定期或偶尔打电话而设计,而且WhatsApp是一个论坛,在这里使用表情符号比打字更方便。Skype最初是为了实现与传统“公共交换电话网络”(即有线电话)进行低价通话或免费通话而推出的,WhatsApp则完全跳过了这个功能。Snapchat的设计者认为,移动通信是图像至上的,智能手机上的前置摄像头比更常用的、分辨率更高的后置摄像头更重要,并因此建立了许多AR镜头来增强这种体验。Slack则为企业建立了一个可以提高生产力的工具,并通过程序将这些工具整合到各种生产力工具、在线服务中。

监管更加严格也更不容易改变的支付领域,也受到计算和网络平台代际变化的影响。20世纪90年代末,康菲尼迪(Confinity)和埃隆·马斯克的X.com这样的点对点数字支付网络,迅速成为消费者首选的汇款方式。后来康菲尼迪和X.com合并成为PayPal。2010年,PayPal每年处理近1 000亿美元的付款业务。10年后,这一数额超过了1万亿美元,部分原因是PayPal于2012年收购了Venmo。

其实,我们已经可以看到元宇宙的雏形了。在平台和操作系统方面,最受关注的竞争者是Roblox和《我的世界》等虚拟世界平台,以及Epic Games的虚幻引擎和Unity Technologies的Unity引擎等实时渲染引擎。这些都是在iOS或Windows系统等底层操作系统上运行的,但它们往往是这些平台的开发者与终端用户之间的媒介。同时,Discord运营着最大的通信平台和社交网络,专注于打造电子游戏和虚拟世界。仅在2021年,就有超过16万亿美元通过区块链和加密货币网络进行结算,在许多专家看来,这些网络是元宇宙的基础性推动因素(详见第11章)。与之形成对比的是,通过Visa结算的金额约为10.5万亿美元。

像互联网一样颠覆世界

将元宇宙看作“下一代互联网”,有助于解释它可能具备的颠覆性。 再一次考虑一下,“互联网”这个词是一个整体概念,其英文internet没有复数形式,不存在“Facebook互联网”或“谷歌互联网”这样的说法。而Facebook和谷歌运营的平台、服务和硬件又在互联网上运行,这实际上就表明“网络的网络”独立运营,拥有不同的技术堆栈,但使用共同的标准和协议。对于一家公司来说,开发、拥有和控制TCP/IP协议并没有不可逾越的技术障碍。有些公司,比如IBM,试图推出自己的专有套件,参与了这场所谓的协议战争。然而,人们普遍认为,这种行为将会使互联网的用户群体更小、创造的利润更低、创新能力更不足。

我们希望元宇宙的建立与互联网的建立秉承大致相似的原则。许多组织都将想方设法建立或把控元宇宙。而就像蒂姆·斯威尼所担心的那样,其中一个组织有可能取得成功。然而, 更有可能的是,元宇宙将通过许多相互竞争的虚拟世界平台和技术的部分整合而产生。这个过程需要时间。通过这种方式产生的元宇宙也将是不完美的,还可以进行无穷无尽的改进,因此在这个过程中,我们将面临重大的技术限制。但这是我们应该期待并努力实现的未来。

此外,元宇宙不会取代或从根本上改变互联网的基础架构或协议套件,它将以一种独特的方式在此基础上发展。想想互联网的当前状态,我们称其为移动互联网时代,但大多数互联网流量仍然是通过固定线路电缆传输的,甚至包括从移动设备发送的数据。而且,这些互联网流量大多是在几十年前设计的标准、协议和格式上运行的,尽管这些部分后来有所发展,但从根本上说仍显陈旧。我们还继续使用一些为早期互联网设计的软件,如微软的Windows系统或Office办公软件,以及一些硬件,这些软件和硬件从那时起已经发展起来,但与几十年前相比没有太大变化。尽管如此,我们也很容易看出移动互联网时代与20世纪90年代至21世纪初以固定线路为主的互联网时代是不同的。我们现在主要是为满足新需求而使用由不同公司制造的不同设备,并为实现不同需求而使用不同类型的软件,这些软件主要是应用程序,而不是通用软件和网络浏览器。

我们也认识到,互联网是许多不同“事物”的集合。为了与互联网互动,普通人通常需要使用网络浏览器或应用程序(软件),而要使用网络浏览器或应用程序,需要借助一个能连接到互联网的设备。该设备本身是通过使用各种芯片组连接到互联网的,所有这些芯片组都使用各种标准和通用协议进行通信,而这些协议通过物理网络得到应用。这些部分结合起来使互联网体验成为可能。没有一家公司能够推动互联网的端到端改进,即使它运营着整个TCP/IP协议,也无法做到。

电子游戏,一个价值1 800亿美元的机会

如果元宇宙确实是互联网的继承者,那么说它的“前辈”来自电子游戏行业似乎很奇怪。毕竟,到目前为止,互联网与电子游戏行业的发展轨迹是完全不同的。

互联网起源于政府的研究实验室和大学。后来,它逐渐扩展到企业,然后是中小企业,最后才是消费者。娱乐业可以说是全球经济体系中最后一个拥抱互联网的部分之一,“流媒体大战”直到2019年——流媒体视频首次公开展示近25年之后才真正开始。即使是音频这种通过IP提供的最简单的媒体类别,其本质仍然是一种非数字媒体。2021年,地面广播、卫星广播和物理媒体占美国录制音乐收入的近2/3。

移动互联网并不是由政府领导的,但它的发展轨迹大致相同。20世纪90年代初,移动互联网刚刚兴起时,使用移动互联网并为它进行软件开发的组织主要是政府和企业。20世纪90年代末至21世纪初,移动互联网才在中小型企业中逐渐普及。直到2008年之后,随着iPhone 3G的推出,移动互联网才进入大众市场。在此后的10年里,以消费者为中心的应用程序才大量涌现。

如果我们更仔细地分析这段历史,就会明白为什么游戏——一个价值1 800亿美元的休闲产业,似乎准备改变价值95万亿美元的世界经济。关键是要考虑约束因素在所有技术发展中的作用。

互联网刚出现时,带宽十分有限,延迟相当严重,计算机内存和处理能力严重不足。这意味着用户只能发送很小的文件,即便如此,这个过程仍然需要花费大量的时间。几乎所有的消费者用例,如照片共享、视频流媒体和大量通信都不可能实现。但主要的业务需求——发送消息和基本文件(未格式化的Excel表格,股票采购订单),正是互联网需要支持的基本需要。服务经济规模巨大,以及管理职能在商品经济中具有重要作用,因此,即使是微小的生产力提高也具有非凡的价值。手机的发展过程与互联网的发展过程相似。早期的手机不支持玩游戏或发送照片,更不用说流媒体视频或FaceTime通话了。电子邮件推送比传呼机通知或实时电话要有用得多。

实时渲染3D虚拟世界和模拟非常复杂,因此在个人电脑和互联网刚出现的几十年里,它们显然比几乎所有其他类型的软件和程序更容易受到限制。结果就是,政府和大、中、小型企业几乎都不会用到基于图形的模拟。毕竟,如果在一个虚拟世界中,模拟的火灾情况与现实情况不符,那么它对消防员来说就没什么价值,一颗飞行轨迹不能在重力的作用下发生偏转的子弹对狙击手来说也是如此,而一家建筑公司也不能根据“吸收太阳的热量”这种过于宽泛的想法来设计建筑。但是电子游戏,以及其他所有游戏,都不需要真实的火焰、重力或热力学,它们需要的是有趣。即使是8位的单色游戏也可以很有趣。而这一事实产生的影响在近70年里不断加深。

几十年来,家用或小企业使用的大多数性能过关的CPU和GPU,通常用在电子游戏机或主要用来玩游戏的个人电脑中。当时其他计算软件对CPU和GPU的要求都没有游戏对它们的要求高。2000年,日本政府甚至对自己心爱的索尼公司施加了出口限制,因为日本政府担心该公司新推出的PS2设备可能被用于全球规模的恐怖主义活动,比如,用于处理导弹制导系统。2001年,美国商务部长唐·埃文斯(Don Evans)在吹捧消费电子行业的重要性时说:“昨天的超级计算机就是今天的PS。”2010年,美国空军研究实验室使用1 760台索尼PS3建立了世界上第33台最大的超级计算机,并取名为“鹫群”(Condor Cluster)。该项目负责人估计,“鹫群”的成本是同类系统的5%~10%,耗能是同类系统的10%。这台超级计算机被用于雷达增强、模式识别、卫星图像处理和人工智能研究。

英伟达,通过电子游戏构建元宇宙

那些通常致力于使电子游戏机和个人电脑获得更佳性能的公司,现在已经成为人类历史上最强大的技术公司。计算和系统芯片巨头英伟达就是最好的例子。英伟达虽然不是一个家喻户晓的企业,但已与面向消费者的技术平台GAFAM一样跻身全球十大上市公司之列。

黄仁勋在创办英伟达时,并没有打算将它做成游戏业巨头。事实上,他创立公司时的信念是:人们终将需要基于图形的计算来解决通用计算永远无法解决的问题和难题。对黄仁勋来说,开发必要的性能和技术的最佳途径是专注于电子游戏领域。2021年,黄仁勋在《时代周刊》的访谈中表示:“一个规模庞大的市场对技术要求高,这种情况极为罕见。通常的情况是,市场对真正强大的计算机的需求非常小,比如用于气候模拟或分子动力学药物发现。这类市场非常小,因此没有人在这些方面投入大量资金。这就是为什么你没有看到一个公司是为了专门做气候研究而成立的。因此,开发电子游戏是我们做出的最好的战略决策之一。”

英伟达在《雪崩》出版仅一年之后就成立了,这表明游戏行业很快意识到了这本书是一部开创性作品。尽管如此,斯蒂芬森表示,通过游戏构建元宇宙是他在小说中“完全忽略的内容”。“当我在设想元宇宙时,我尝试找出使所有这些东西都负担得起的市场机制。在我写作《雪崩》时,3D成像硬件贵得离谱,只有少数研究实验室才有。我想,如果它要变得像电视一样便宜,那么就必须有一个像电视市场一样大的3D成像市场。所以《雪崩》中的元宇宙有点儿像电视……我没有预料到的是,实际上推动3D成像硬件成本下降的是游戏。所以我们都在谈论的、在20年前想象的VR并没有像预测的那样出现,而是以电子游戏的形式出现了。”

同样,最擅长实时3D渲染的软件解决方案也来自游戏行业,最明显的例子是虚幻引擎和Unity引擎。但也有几十个电子游戏开发商和发行商拥有很强大的专有实时渲染解决方案。

虽然存在非游戏替代品,但至少从目前来看,人们普遍认为它们的实时性能较差,特别是因为从一开始它们就不会面临这种限制。为制造或设计胶片的渲染解决方案不需要在1/30或1/120秒内处理图像。相反,它们优先考虑其他目标,比如最大限度地提高视觉丰富度或使用相同的文件格式来设计和制造对象的能力。这些解决方案通常是为在高端机器上运行而设计的,而世界上几乎所有的消费设备都不在此列。

游戏开发商、发行商和平台几十年来一直想方设法对抗或绕开互联网的网络架构,因此在向元宇宙转变的过程中掌握了独特的专业知识,而这种优势经常被人们忽视。自20世纪90年代末以来,网络游戏一直需要同步和持续的网络连接,大约从2005年开始,Xbox、PS和Steam的大部分游戏都支持实时音频聊天。要做到这一点,需要满足三个条件。首先,我们需要有预测能力的人工智能程序,能够在玩家网络中断时接替他们,然后等网络恢复时再把控制权交还给玩家。其次,我们需要一个自定义软件,在一个玩家突然比另一个玩家先收到信息的情况下,可以不引人注意地“回放”游戏。最后,我们创造的游戏玩法对应的技术挑战是大多数玩家都能完成的,而不是选择无视大多数玩家。

这种设计导向令游戏公司获得了最终优势:有能力创造一个人们真正愿意花时间待着的地方。Spotify的联合创始人兼首席执行官丹尼尔·艾克(Daniel Ek)认为,互联网时代的主流商业模式是将任何由原子构成的东西分解成比特,比如曾经放在床头柜上的实物闹钟,变成了放在床头柜上的智能手机上的应用程序,或者是存储在旁边的智能音箱上的数据。简单来说,在元宇宙时代,我们使用比特来生产由虚拟原子构成的3D闹钟。那些在虚拟原子方面最有经验的人,是在这方面拥有数十年经验的游戏开发者。他们不仅知道如何制作一个3D时钟,还知道如何建造一个3D房间、一幢3D建筑物和一个供快乐的玩家居住的3D村庄。如果人类要走向一个“大规模、可互操作、实时渲染的3D虚拟世界网络”,这种技能将带我们抵达那里。在问及《雪崩》中对未来的构想是否正确时,斯蒂芬森告诉《福布斯》的记者,“与《雪崩》中描写的人们会聚集在主街上的酒吧里不同,我们现在拥有的是《魔兽争霸》(Warcraft)中的公会”,公会成员会在游戏中发动突袭。

在本书的第一部分,我已经详细介绍了“元宇宙”一词及其灵感的来源、过去几十年来人们为构建元宇宙所做的各种努力,以及它对未来的重要性。此外,我通过调查发现了企业对元宇宙——移动互联网可能的继承者的期待,回顾了关于元宇宙的困惑是如何产生的,以及它们将继续产生怎样的重大影响。同时,我还给出了元宇宙的一个可行定义,并探讨了为什么电子游戏开发商似乎处于这一领域的前沿。现在,让我来告诉你该如何让元宇宙成为现实吧!

THE METAVERSE 透视元宇宙

互联网浪潮已过,元宇宙时代已来

1.将元宇宙看作“下一代互联网”,有助于解释它可能具备的颠覆性。

2.我们希望元宇宙的建立与互联网的建立秉承大致相似的原则。

3.元宇宙将需要开发新的标准,创建新的基础设施,可能还需要对长期存在的TCP/IP协议进行彻底改革,包括采用新的设备和硬件,甚至可能打破技术巨头、独立开发者和终端用户之间的权利平衡。

4.电子游戏开发商处于元宇宙这一领域的前沿。游戏开发商、发行商和平台几十年来一直想方设法对抗或绕开互联网的网络架构,因此在向元宇宙转变的过程中掌握了独特的专业知识,而这种优势经常被人们忽视。这种设计导向令游戏公司获得了最终优势:有能力创造一个人们真正愿意花时间待着的地方。

让元宇宙成为现实。

05

网络化,元宇宙的门槛

“如果森林中的一棵树倒下,但周围没有人听到,那它是否会发出声音?”这一思想实验可以追溯到数百年前。这个实验之所以经久不衰,部分原因是它很有趣,而它之所以很有趣,是因为它耐人寻味并且融入了哲思。

人们通常认为,上面这个问题最初是由主观唯心主义哲学家乔治·贝克莱(George Berkeley)提出的,他认为“存在就是被感知”。如果有人或有其他事物在感知这棵树,那么不管这棵树是直立的、正在倒下还是已经倒在地上,都表明它是存在的。也有人认为,我们所说的“声音”只是在物质中传播的振动,无论是否被观察者接收,它都是存在的。也有人说,声音是当这些振动与神经末梢相互作用时,大脑所体验到的感觉,如果没有神经与振动的粒子相互作用,就不可能产生声音。然后,几十年前,人类就制造出能够将振动转化为声音的物理设备,这样一来,我们就能够通过人类观察者听到声音。但这也算吗?同时,今天的量子力学界基本上认同,如果没有观察者,存在充其量只是一种猜想,无法证明或反驳,因此我们只能说,树可能存在。(量子力学理论奠基人之一爱因斯坦对这一观点表示异议。)

在本书第二部分中,我将从网络化和计算能力开始,解释如何驱动和构建元宇宙,然后再介绍运营着众多虚拟世界的游戏引擎和平台、将这些虚拟世界联合起来所需的标准,以及访问虚拟世界所需的设备和虚拟世界的经济体系所依托的支付途径。在了解这些内容的过程中,我希望你们记住“贝克莱的树”。

为什么?因为即使元宇宙能够“完全实现”,它也不会以实体的形式存在。 元宇宙和其中的每一棵树、每一片叶子以及它们所在的森林,将只是存储在一个看似无限的服务器网络中的数据。虽然有人可能会说,只要这些数据存在,元宇宙和其中的内容就存在,但除了数据库之外,我们还需要许多不同的步骤和技术才能使元宇宙存在。此外,“元宇宙堆栈”的每一部分都为一家公司提供了实现元宇宙的手段,由此这家公司能够了解到什么是可行的、什么是不可行的。例如,你会发现今天能观察到高保真树倒下的人只有几十个,如何才能让更多的用户观察到呢?一种技巧是复制虚拟世界,换句话说,为了让许多人听到一棵树倒下的声音,就必须有很多树倒下。(试试这个,贝克莱!)或者,也许它的观察者面临着时间延迟,因此也无法影响倒下或证明倒下与声音之间的相关性。另一个技巧是将树皮简化为无纹理的、统一的棕色,并将其倒下的声音简化为一般的“砰”的一声。

为了揭示这些限制及其影响,我先介绍一个真实的例子:我认为当今技术上最令人印象深刻的虚拟世界并不是Roblox,也不是《堡垒之夜》。事实上,这个虚拟世界在其生命周期内触达的用户可能比这些游戏一天触达的玩家都要少。甚至称它为游戏也是不公平的,因为到目前为止我们看到的许多虚拟世界都是游戏中的。而我要说的这个虚拟世界并不是游戏,人们设计它是为了精确再现许多人认为不愉快的、枯燥的或可怕的经历——乘飞机旅行。

突破带宽局限,让我们在虚拟世界自由切换

第一部《飞行模拟器》(Flight Simulator)于1979年发布,并迅速在小范围内掀起了热潮。3年后(距离第一台Xbox发布还有将近20年),微软获得了该游戏的授权,此后一直到2006年,又发布了10个版本。2012年,吉尼斯世界纪录将《飞行模拟器》命名为运行时间最长的电子游戏系列,尽管它仍然不为大多数玩家所知。直到2020年该系列的第12个版本《微软模拟飞行》发布,这款游戏才飞速进入公众视野。《时代周刊》将其评为年度最佳游戏之一。《纽约时报》称《微软模拟飞行》提供了“一种理解数字世界的新方法”,通过模式飞行中的视野,我们获得的体验“比现实世界中从飞机里看外面的体验更真实,我们看到的画面能帮助我们理解现实世界”。

从理论上讲,《微软模拟飞行》就是许多人眼中的那样:一款游戏。在打开应用程序的几秒钟内,你会看到“游戏由微软Xbox游戏工作室开发和发布”的字样。然而,《微软模拟飞行》的目标不是与其他玩家或与使用人工智能技术设计的竞争对手展开对抗,通过射击打败对方,依靠得分赢得比赛,而是驾驶一架虚拟飞机,这个过程涉及许多驾驶真实飞机时要做的工作。在按照他们选择或指定的飞行路线飞行之前,玩家将与虚拟世界的空中交通管制人员和副驾驶沟通,等待起飞许可,设置飞行高度表和襟翼,检查燃料储备和混合物情况,松开刹车装置,缓慢地推动油门,等等。与此同时,玩家还要处理存在冲突的路线,并考虑其他虚拟飞机的飞行路线。

《微软模拟飞行》系列的每一个作品都提供了这种功能,但2020年发布的第12版是非同寻常的,是历史上最真实、最全面的消费者级模拟。它的地图超过500 000 000平方千米,就像“真正的”地球,上面有两万亿棵分别单独渲染的树(而不是两万亿棵复制粘贴的树,也不是先渲染出几十种不同类型的树,再通过复制粘贴得到的两万亿棵树)、15亿幢建筑,以及全世界几乎所有的道路、山脉、城市和机场。一切看起来都像“真实的东西”,因为《微软模拟飞行》的虚拟世界以“真实物体”的高质量扫描和图像为基础。

《微软模拟飞行》的复制品和渲染并不完美,但仍然令人惊叹。玩家可以飞过自己的房子,看到自家的邮箱或前院的轮胎秋千。当出现海湾的日落以及机翼折射出的夕阳时,玩家也很难分辨《微软模拟飞行》的屏幕截图和真实世界的照片。

为了达到这种逼真的效果,《微软模拟飞行》的虚拟世界有近2.5PB(约2.5×10 6GB)之大,即约250万GB,是《堡垒之夜》大小的1 000倍左右。消费级设备(或大多数企业设备)没有办法存储如此大量的数据。大多数游戏机和个人电脑的最高容量为1 000GB,而消费级网络附加存储设备的最大容量是20 000GB,而且它的零售价接近750美元。因此,要想存储2.5PB的数据需要很多块这样的存储设备,光是存放它们就需要很大的空间。

但是,即使用户能买得起这样的存储设备,并有足够的空间来存放它们也无济于事,因为《微软模拟飞行》也是一种实时服务。它通过更新来反映真实世界的天气(包括准确的风速和风向、温度、湿度、雨水和光线)、空中交通和其他地理变化。这使得玩家可以飞入真实世界的飓风中,或者在真实世界中沿着真实商业客机的确切飞行路线跟踪它们。这意味着用户不能“预先购买”或“预先下载”所有《微软模拟飞行》数据,因为它的大部分内容还不存在!

《微软模拟飞行》的工作原理是在用户的设备上存储相对较小(约150GB)的“游戏”部分。这一部分足以运行游戏,其中包含所有游戏代码、众多飞机的视觉信息和一些地图。因此,《微软模拟飞行》可以离线使用。然而,离线用户看到的主要是程序生成的环境和物体,像曼哈顿城这样的地标性建筑大致仍是大众熟悉的模样,但其中充斥着大量通过复制粘贴生成的建筑,与现实世界的对应建筑只偶尔有很少的相似之处。同时,游戏也存在一些预先设计好的飞行路线,但它们不能模仿实际的实时路线,离线使用时,一个玩家也不能看到另一个玩家的飞机。

只有当玩家在线时,《微软模拟飞行》才会变成一个神奇的世界,微软的服务器会将新的地图、物体的纹理、天气数据、飞行路线以及用户可能需要的任何其他信息串联起来。从某种意义上说,玩家在《微软模拟飞行》的世界中获得的体验,与现实世界中的飞行员是一样的。当他们飞过或绕过一座山时,新的信息通过光粒子进入他们的视网膜,他们能够真正看清那里的情况。未看清楚之前,玩家只知道,从逻辑上讲,那里一定有什么东西。

许多玩家认为这是所有在线多人电子游戏中出现的情况。但实际上,大多数在线游戏都尽量提前向用户发送尽可能多的信息,而在他们玩游戏过程中则尽量少发送。这就解释了为什么玩一个游戏,即使是像《超级马里奥兄弟》这样相对较小的游戏,也需要购买包含数千兆字节游戏文件的数字光盘,或者花几小时下载这些文件,然后花更多时间安装它们。我们还可能不时地被告知要下载和安装一个数千兆字节的更新,然后才能继续游戏。这些文件如此之大,是因为它们几乎包含了整个游戏,即游戏代码、游戏逻辑,以及游戏环境所需的所有资产和纹理,比如每一种类型的树、每一个化身、每一场BOSS战斗、每一件武器等。

对于常见的网络游戏来说,真正需要在线多人服务器提供的内容多吗?并不多。《堡垒之夜》的PC端游戏文件和主机游戏文件大约有30GB,但在线游戏每小时只需下载20~50MB数据。这些信息能够告诉玩家的设备该如何处理它们已经拥有的数据。例如,如果你正在线玩《马里奥赛车》( Mario Kart),任天堂的服务器会告诉你的任天堂Switch,你的对手正在使用哪些角色,因此应该加载这些角色。在比赛期间,你与该服务器的持续连接使它能够不断发送数据流来说明这些对手的确切位置(位置数据)、他们正在做什么(向你发送红色炮弹)、通话信息(例如你的队友发送的音频),以及其他各种信息(如还有多少球员仍在比赛中)。

网络游戏仍然“大部分是离线的”,这对狂热的游戏玩家来说竟然是一个惊喜。现在大多数音乐和视频都是通过流媒体播放的,我们不用预先下载歌曲或电视节目,更不用购买实体CD来存储它们,而且电子游戏应该是一个技术上更复杂、更具前瞻性的媒体类别。然而,正是因为游戏如此复杂,那些制作游戏的人选择尽量少依赖互联网, 因为互联网并不可靠。连接是不可靠的,带宽是不可靠的,延迟是不可靠的。正如我在第3章中所阐述的,大多数在线体验都能在这种不可靠的情况下存在,但游戏不能。因此,游戏开发者会选择尽量少依赖互联网。

用离线方式应对网络游戏可能出现的问题,这种方法效果很好,但也存在许多局限。例如,服务器只能告诉某个用户哪些资产、纹理和模型应该被渲染,这意味着服务器必须事先了解并存储每个资产、纹理和模型。根据需要发送渲染数据,游戏可以拥有更多样化的虚拟对象。《微软模拟飞行》希望每个城镇不仅彼此不同,而且能像现实生活中那样存在。它不想存储100种云,然后告诉设备要渲染哪种云,用什么颜色。它想准确地说出一朵云应该是什么样子的。

今天,当玩家在《堡垒之夜》中看到自己的朋友时,只能使用一套有限的预装动画(或表情)与之互动,如挥手或走太空步。然而,许多用户设想的未来是这样的:他们现实中的面部表情和身体动作在虚拟世界中能够完美重现。在跟朋友打招呼时,他们不会从预装在设备上的20个挥手方式中挑选17个,而是以一种独特的方式做出独特的手指摆动动作。用户还希望能够在与元宇宙相连的无数个虚拟世界中,使用无数虚拟物品和化身。正如《微软模拟飞行》的文件大小所表明的那样,根本不可能提前向用户发送这么多数据。因为这样做不仅需要大到离谱的硬盘,而且虚拟世界还需要提前知道可能创建或执行的任何事情。

“预设”一个原本活生生的虚拟世界还会带来其他问题。每次Epic Games改变《堡垒之夜》的虚拟世界,例如,增加新的目的地、车辆或非玩家角色,用户都必须下载并安装一个更新包。Epic Games增加的内容越多,下载时间就越长,用户必须等待的时间也越长。一个游戏世界的更新越频繁,用户经历的延迟就越多。

分批次的更新过程也意味着虚拟世界不可能是“活生生的”。相反,一个中央服务器选择向所有用户发送一个特定版本的虚拟世界,在被下一次更新取代之前,这个世界将持续存在。每个版本不一定是固定的,每次更新都可能涉及程序上的变化,如除夕夜的活动或每天增加的降雪,但这些都是预先设计好的。

Epic Games,开一场元宇宙演唱会

此外,用户可以去的地方也有限制。在《堡垒之夜》中,特拉维斯·斯科特在举办10分钟时长的演唱会时,大约3 000万玩家瞬间从游戏的核心地图被传送到一个从未见过的海洋深处,接着又被传送到一个从未见过的星球,然后被传送到外太空深处。我们中的许多人可能会想象,元宇宙的运作方式与此类似,用户可以轻松地从一个虚拟世界跳转到另一个虚拟世界,而无须忍受漫长的加载时间。但为了举办演唱会,Epic Games必须在活动开始前几天至前几小时通过标准的《堡垒之夜》补丁向用户发送这些迷你世界(在活动开始前没有下载和安装更新的用户无法参加演唱会)。然后,玩家身处每个场景中时,他们的设备都在后台加载下一个场景。值得注意的是,斯科特演唱会的每一个新目的地都比之前的那个更小,活动范围更有限,最后一个目的地基本上就是提供一种“在轨道上”的体验,用户只是在基本上毫无特色的空间中向前飞行。换句话说,我们可以把前后两个目的地的差别想象成在商场中四处走动和通过移动通道穿越商场的区别。

尽管如此,这场演唱会在创造性方面仍然是一项壮举。但同网络游戏的情况一样,它依赖的是目前无法支持元宇宙的技术选择。实际上,今天最像元宇宙的虚拟世界正在接受一种“本地+云端”的混合数据模型,其中“核心游戏”是预装的,但会根据需要发送数倍的数据。这种方法对于像《马里奥赛车》或《使命召唤》这类物品较少、环境多样性相对单一的游戏来说并不重要,但对于像Roblox和《微软模拟飞行》这样的游戏平台和游戏来说则至关重要。

鉴于Roblox的受欢迎程度和《微软模拟飞行》的巨大规模,现代互联网基础设施似乎已经可以处理元宇宙式的实时数据流了。然而即便如此,这些游戏平台或游戏今天只能以一种高度受限的方式运作。例如,Roblox不需要云计算数据流,因为它的大多数游戏项目都是预先设计好的,游戏只需要告诉用户的设备如何调整、如何重新着色或如何重新排列以前下载的物品。此外,Roblox的图形保真度相对来说并不高,因此其纹理和环境文件的大小也相对较小。总的来说,Roblox的数据使用量比《堡垒之夜》大得多,大约每小时使用100~300MB,而不是30~50MB,但仍在可接受的范围内。根据目标设置,《微软模拟飞行》每小时需要的带宽是《堡垒之夜》的近25倍,是Roblox的近5倍。这是因为《微软模拟飞行》向用户的设备发送的不是关于如何重新配置或重新着色预装房屋的数据,而是发送一个几千千米之外的云朵的精确尺寸、密度和颜色,或者一个几乎精确的墨西哥湾海岸线的副本。虽然对保真度的需求通过一些方法被简化了,但对“元宇宙”来说,这些简化方法是行不通的。

虽然《微软模拟飞行》需要大量数据,但它并不需要特别快的运行速度。与现实世界的飞行员一样,《微软模拟飞行》中的飞行员不可能突然从美国被传送到新西兰,也不可能从曼哈顿的万米高空俯视奥尔巴尼市中心,更不可能在几分钟内从高空直接降落在停机坪上。这为玩家的设备提供了大量时间来下载它需要的数据,甚至能够在玩家选择目的地之前预测并开始下载它需要的数据。即使这些数据没有被及时下载下来,后果也不严重:譬如曼哈顿的一些建筑将暂时使用程序生成的版本,当然,它们看起来不像是真实的建筑物,当所需数据下载下来后,再给这些建筑物加上真实的细节就可以了。

这样看来,《微软模拟飞行》的虚拟世界与立体模型之间有更多的共同点,而不太像与尼尔·斯蒂芬森描绘的繁华而不可预知的主街。向用户发送这种不容易预测的数据,其中包含的细节信息远远超过办公园区或森林的视觉细节,因此每小时需要的数据量将远远超过1GB。这是今天的互联网连接面临的又一个问题,也可以说是最为人所诟病的问题——延迟。

破解延迟难题,让世界无缝即时连接

带宽和延迟经常被混为一谈,这种错误是可以理解的,因为它们都会影响单位时间内可以发送或接收的数据量。区分这两者的经典方法是,把你的互联网连接比作一条高速公路。你可以把“带宽”看作高速公路上的车道数量,把“延迟”看作速度限制。如果一条高速公路有更多的车道,它可以承载更多汽车和卡车的通行而不至于拥堵。但是,如果高速公路允许的速度被限制得很低,也许是因为有太多的弯道,或者是因为铺设的是碎石路而不是柏油路,那么即使有多余的车道,车流也会很缓慢。同样,如果只有一条车道,哪怕最高限速被定得很高,也会导致持续拥堵: 限速是一种愿望,而不是现实。

实时渲染的虚拟世界所面临的挑战是,用户并不是把一辆车从一个目的地发送到另一个目的地。相反,他们正在发送一个永无止境的车队,并把它们连接在一起(要记住,我们需要的是一个“连续性连接”),往返于目的地之间。用户不可能提前发送这些汽车,因为只有到了出发前几毫秒,才能确定要发送的是哪些车。更重要的是,我们需要这些汽车以尽可能快的速度行驶,并且不被转移到另一条路线上(即使保持最高速度,也会切断连续性连接,延长运输时间)。

设计一个符合并能维持这些规格的全球道路系统,是一项巨大的挑战。在第一部分中,我解释说,今天很少有在线服务需要超低的延迟。在发送WhatsApp信息和收到阅读回执之间需要100毫秒还是200毫秒甚至是2秒的延迟并不重要。如果用户点击YouTube的暂停按钮后需要20毫秒、150毫秒或300毫秒,视频才会停止,这也不重要,因为大多数用户可能不会注意到20毫秒和50毫秒之间的区别。人们在观看奈飞上的视频时,更看重的是视频的稳定播放,而不是立即播放。虽然Zoom视频通话中的延迟很烦人,但参与者很容易解决这个问题,他们只需习惯在说话人停止讲话后等待一会儿即可。只需等一秒钟(1 000毫秒),这个问题就能得到解决。

在交互体验中,人类对延迟的感知阈值是非常低的。用户必须本能地感觉到他们的输入确实是有效果的——延迟反应意味着“游戏”在对新的决定做出反应后,才对旧的决定做出了反应。同样,与延迟程度较低的用户在游戏中对抗时,你往往会感觉你的对手来自未来,他们拥有超快的速度,能够抵挡你还没有使出的一击。

回想一下你上次在飞机上、iPad上或剧院里观看电影或电视节目时,音频和视频稍微有点不同步的情况。可能人们压根儿不会注意到同步问题,除非音频提前超过45毫秒或推迟超过125毫秒(总差异超过170毫秒)。通常所说的可接受阈值范围甚至更大——早90毫秒晚185毫秒(总差异为275毫秒)。对于数字按钮,例如YouTube的暂停按钮,一般人只有在软件反应需要200~250毫秒时才会认为自己点击失败了。对于《堡垒之夜》、Roblox或《侠盗猎车手》( Grand Theft Auto)等,狂热的游戏玩家在延迟达到50毫秒时就会感到失望(大多数游戏发行商希望延迟最多为20毫秒)。即便是休闲游戏玩家,在延迟达到110毫秒时也会发现输入延迟,意识到这不是因为自己缺乏经验。而在延迟达到150毫秒时,需要快速反应的游戏根本无法进行下去。

那么,网络出现延迟时,实际上发生了什么呢?在美国,数据从一个城市发送到另一个城市再返回的时间中位数是35毫秒。在很多情况下,数据往返的传输时间都超过了这一数值,特别是在需求高度密集的城市和处于需求高峰时段的城市之间,比如,晚上在旧金山和纽约之间传输的数据。注意,这只是城市与城市或数据中心与数据中心之间的传输时间。数据从城市中心传输到用户设备也需要时间,这特别容易造成传输速度减慢。人口密度较大的城市、个人公寓和数据传输需求较高的局域网很容易出现数据拥挤,而且在这些地方铺设的往往是带宽有限的铜缆,而不是支持大容量传输的光纤。那些住在大城市之外的人可能位于总长几十甚至几百千米的铜线传输网络的末端。对于那些最后一千米使用的是无线网络的人来说,4G增加了多达40毫秒的传输时间。

尽管有这些挑战,美国的数据往返交付时间通常在可接受的范围之内。然而,所有的连接都会遭遇时延“抖动”(jitter),即不同数据包的交付时间相对于中位数交付时间的差异。虽然大多数时延抖动与连接的延迟中位数相差不大,但由于网络路径上某个地方出现了不可预见的拥堵,时延抖动经常会飙升至正常情况下的几倍。这种拥堵的原因不仅包括终端用户网络受到其他电子设备的干扰,还可能是家庭成员或邻居在看视频或在下载文件。虽然这是暂时的,但很容易导致一个快节奏的游戏难以继续或导致网络连接中断。再说一遍,网络并不可靠。

为了应对延迟的情况,在线游戏行业已经开发了许多种部分解决方案和变通方法。例如,大多数高保真多人游戏是围绕服务器区域进行“匹配”的。通过限制玩家的地理位置,比如只允许居住在美国东北部、西欧或东南亚的人访问,游戏发行商可以将每个地区的延迟降到最低。由于游戏是一种休闲活动,而且通常是与1~3个朋友一起玩,这种组团的效果足够好。你不太可能想和几个时区以外的某个人玩,而且你也不太关心你的未知对手住在哪里(在大多数情况下,你很有可能无法和他们交谈)。

多人在线游戏也使用“网络代码”的解决方案,以确保同步性和一致性,并使玩家能够继续游戏。基于延迟的网络代码将告诉玩家的设备(如PS5)主动延迟渲染其主人的输入,直到更多潜在玩家(他们的对手)的输入到达。这会使已经形成了低延迟的肌肉记忆的玩家感到恼火,但这种方法确实有效。回滚网络代码(rollback netcode)是更为复杂的应对方法。如果对手的输入延迟了,玩家的设备将根据它所预期的情况进行操作。如果发现对手做了一些不太对劲的事情,设备将尝试展开过程中的动画,然后“正确地”回放它们。

尽管这些变通方法是有效的,但它们的适用范围很小。网络代码对于那些十分容易预测玩家输入的游戏(如驾驶模拟),或者那些需要同步的玩家相对较少的游戏(如大多数格斗游戏),效果很好。然而,如果要正确预测并连贯地同步几十个玩家的行为,其难度会呈指数级增长,尤其是当他们进入一个有流动的云环境和资产数据的沙盒式虚拟世界中时。这就是为什么实时带宽技术公司Subspace估计,使用宽带上网的美国家庭中,只有3/4的家庭可以持续(但远非完美)地参与当今的高保真实时虚拟世界,如《堡垒之夜》和《使命召唤》,而在中东地区,这一比例不足1/4。而且仅仅能达到延迟阈值是不够的。Subspace发现,延迟平均增加或减少10毫秒,就会使每周的游戏时间增加或减少6%。更重要的是,保持这种相关性,哪怕是狂热的游戏者也无法发现网络延迟,如果他们的连接时间是15毫秒,而不是25毫秒,他们用来玩游戏的时间相当于增加了6%。几乎没有其他类型的业务对延迟如此敏感,而游戏是一种需要玩家参与的业务,因此网络延迟对游戏收入的影响相当大。

网络延迟似乎是游戏特有的一个问题,而不是元宇宙面临的问题。但同样值得注意的是,在延迟这一点上,这些问题只会影响部分游戏收入。许多热门游戏,如《炉石传说》和《与朋友猜词》(Words With Friends),都是回合制或异步性的,而其他同步性游戏,如《王者荣耀》和《糖果粉碎》(Candy Crush),既不需要完美的像素,也不需要毫秒级精确的输入。然而,元宇宙需要低延迟。轻微的面部动作对人类对话来说是非常重要的。我们对轻微的错误和同步问题也非常敏感,这就是为什么我们不在意皮克斯的一个卡通角色的嘴巴怎么动,但如果3D动画中一个活灵活现的人的嘴唇动起来不太对劲,我们立刻就会觉得毛骨悚然(动画师称这种现象为“恐怖谷”效应)。如果你与你的母亲交谈时,她好像处于100毫秒的延迟状态,那么你很快就会觉得有点恐怖。虽然元宇宙中的互动对延迟的要求不像像素射击游戏那样高,但所需的数据量要比后者大得多。回想一下,延迟和带宽共同影响着单位时间内可以传输多少信息。

社交产品也取决于有多少用户能够使用并且确实在使用它们。尽管大多数多人游戏都是与同一时区的其他人一起玩的,或者可能是与相隔一个时区的人一起玩的,但互联网之间的通信往往跨越整个地球。之前我提到,从美国东北部向美国东南部发送数据需要35毫秒。在各大洲之间的传输时间会更长,从美国东北部到东北亚的数据传递时间中位数高达350~400毫秒,而且用户与用户之间的数据传输时间会更长(高达700毫秒~1秒)。试想一下,除非你和你的朋友或家人相距不超过800千米,否则FaceTime或Facebook就无法正常工作了,或者只有当你在家的时候才会使用它们。如果一家公司想在虚拟世界中聘用国外或远程的员工,它将需要延迟时间低于0.5秒的连接。虚拟世界中每增加一位用户,都会加重同步问题带来的挑战。

基于AR的体验对延迟有特别严格的要求,因为这种体验是建立在头部运动和眼睛运动的基础上的。如果你戴着AR眼镜,可能认为当自己转身时,眼睛会立即适应周围的环境,并在0.000 01毫秒内接收到光粒子,这是理所当然的。但想象一下,如果在接收这些新信息时有10~100毫秒的延迟,你会有什么感觉?

我们在不断与光速作斗争

延迟是通向元宇宙之路的最大网络障碍。部分原因是,今天很少有服务和应用需要超低延迟交付,这反过来又使致力于提供实时交付服务的网络运营商或技术公司更难生存。这里的好消息是,随着元宇宙的发展,人们对低延迟的互联网基础设施的投资将会增加。征服延迟的确能让我们赚到钱,但我们还需要突破物理定律的限制。有一家领先的电子游戏发行商具备为云计算交付游戏的经验,用该公司首席执行官的话来说就是:“我们在不断地与光速作斗争。但无论现在还是将来,我们都难以望其项背。”考虑一下在超低延迟水平下从纽约市向东京或孟买发送哪怕一个字节有多困难。如果传输速度能达到光速,那么向11 000~12 500千米外发送一个字节,只需40~45毫秒。光速只比竞争力极强的电子游戏的目标最低值快10%~20%。听起来好像我们并没有输给物理定律。但在实践中,我们远远没有达到这个40~45毫秒的基准值。从亚马逊的美国东北部数据中心(服务于纽约市)向其东南亚太平洋数据中心(服务于孟买和东京)发送数据包的平均延迟是230毫秒。

造成这种延迟的原因有很多。其中一个原因是光纤的材质为硅玻璃。虽然许多人认为通过光缆发送的数据以光速传输,但他们的想法并不完全正确。光束本身确实以光速传播,我们都学过,光速是一个常数,但即使光缆本身是沿直线铺设的,光也并不是沿直线传播的。这是因为玻璃纤维与真空不同,会折射光线。因此,数据的传输路径更接近于在玻璃纤维的边缘不断反射形成的连续的之字形。其结果是传输路径被拉长了近31%,这就使延迟达到58~65毫秒。

此外,大多数网络线缆并不是沿直线铺设的,在铺设时必须考虑国际权利、地理障碍并做出成本/收益分析。因此,许多国家和许多主要城市并没有直接相连的网络线缆。纽约市有一条直达法国的海底线缆,但没有直达葡萄牙的。美国的网络线缆直达东京,但要到达印度,就需要从美国铺设一条海底线缆与亚洲或大洋洲的另一条海底电缆连接起来。铺设一条从美国到印度的线缆当然也是可以的,但它需要穿过或绕过泰国,因此会增加几百甚至几千千米,而这只能解决岸对岸的传输问题。

令人惊讶的是,升级国内互联网基础设施比升级国际互联网基础设施更难。铺设或更换线缆意味着要在四通八达的交通基础设施(高速公路和铁路)、各种人口中心(每个人口中心都有自己的政治进程、选民和激励措施)以及受保护的公园和土地周围施工。在公海的海底山上铺设电缆比在私人或公共山脉上铺设电缆要简单得多。

“互联网骨干网”(internet backbone)这个短语可能会让人联想到一个基本已经规划好的、部分联合在一起的线缆网络。实际上,“互联网骨干网”是一个松散的私人网络的联合体。这些网络从来都不是为了在全国范围内提高数据传输效率而铺设的,相反,它们是为了给当地居民提供网络服务而铺设的。例如,一个私人网络运营商可能在两个郊区甚至两个办公园区之间安装一条光纤线路。在铺设线缆时,需要考虑到许可证的费用和铺设的便利程度,而不是沿着直线将两个城市连接起来,因此人们通常会在其他基础设施正在建设的时候和地方铺设线缆。

当数据在两个城市(如纽约和旧金山,或洛杉矶和旧金山)之间传输时,它的传输路径可能是由几个不同的网络串联起来的(每一段叫作一个hop)。设计这些网络不是为了尽量缩短这两个城市之间的距离或传输时间。因此,一个数据包在用户和服务器之间的传输距离可能比它们之间的地理距离远得多。

而作为TCP/IP协议核心应用层协议之一的BGP协议则增加了这一挑战的难度。第3章提到,BGP协议作为一种空中交通卫士,通过在互联网上传输数据,帮助每个网络确定通过其他哪个网络来路由数据。然而,它在做这些事情时并不知道正在发送什么、向哪个方向发送或这样做有什么意义。因此,它通过应用一种相当标准化的方法来“帮助”解决问题,这种方法优先考虑的是成本。

BGP协议的规则集体现了互联网最初的异步网络设计。它的目标是确保所有数据都能低成本成功传输。但事与愿违,许多传输路径远远超过了必要的长度。位于曼哈顿同一幢楼的两名玩家可能参加《堡垒之夜》中的同一场比赛,由位于弗吉尼亚州的《堡垒之夜》服务器管理,数据包可能先经过俄亥俄州发送,因此到达目的地的时间要多出50%。数据可能会通过一条更长的网络路径被传送回其中一个玩家的设备,这条路径要经过芝加哥。这些连接中的任何一个都有可能被切断,或反复出现150毫秒的延迟,而这样做都是为了优先考虑那些不需要实时交付的流量(如电子邮件)。

所有这些因素结合在一起,就能够解释为什么数据包从纽约到东京的平均传输时间是光粒子传播相同距离所需时间的4倍多,从纽约到孟买的时间是光粒子传播所需时间的5倍多,而从纽约到达旧金山的时间是光粒子传播所需时间的2~4倍,确切的传输时间取决于具体的传输时段。

改善交付时间所面临的高昂成本、困难程度和过程的漫长超乎我们想象。更换或升级由线缆组成的基础设施不仅成本高昂,还需要政府批准,通常是逐级批准。这些线缆的预期路径越趋近于直线,审批往往就越困难,因为越是直接连通的路径,越有可能影响已有住宅、商业设施、政府财产或环境保护等。

而升级无线基础设施则容易得多。5G网络主要被标榜为向无线用户提供“超低延迟”的服务,有可能是1毫秒,但20毫秒应该更为现实。这意味着与今天的4G网络相比,5G网络传输相同距离的相同数据可以节省20~40毫秒。然而,这只在数据传输过程中的最后几百米起作用。一旦无线用户的数据到达发射塔台,就会通过固定线路的互联网骨干网传输。

SpaceX旗下的卫星互联网公司Starlink承诺在美国各地提供高带宽、低延迟的互联网服务,并最终覆盖世界其他地区。然而,卫星互联网并不能实现超低延迟,尤其是在距离很远的情况下。截至2021年,Starlink使得数据从你家到卫星的平均传输时间变为18~55毫秒,但当数据必须从纽约到洛杉矶再返回时,这个时间框架就会延长,因为在这个过程中数据需要经过多个卫星网络或传统的地面网络。

在某些情况下,Starlink甚至加剧了传输距离的问题。纽约到费城的直线距离约为160千米,线缆距离可能为260千米,但数据往返低轨道卫星后,总距离则超过1 100千米。不仅如此,通过光缆传输造成的数据“损耗”比光通过大气层传输时的损耗要小得多,特别是在阴天。人口密集的城市地区,因为充满噪声,数据的传输也会受到干扰。2020年,埃隆·马斯克强调,Starlink致力于“服务最难服务的客户(电信公司),否则很难达到超低延迟这一目标”。从这个角度看,卫星传输是使更多人能够达到元宇宙的最低延迟要求,而不是为那些已经满足了这一要求的人提供改进。

BGP协议可能会被更新或通过其他协议进行补充,也可能会引入和采用新的专有标准。我们往往会认为元宇宙能否实现只受Roblox公司、Epic Games或个人创作者的思想和创新的限制,而且这些公司和个人确实已经证明自己善于通过设计避开网络的限制。这些公司和个人将继续这样做,因为我们要应对未来所有的带宽和延迟挑战。然而,至少在不久的将来,这些非常真实的限制将继续制约着元宇宙和其中的一切。

THE METAVERSE 透视元宇宙

元宇宙中需要低延迟,甚至是0延迟

在交互体验中,人类对延迟的感知阈值是非常低的。而延迟,是通向元宇宙之路的最大网络障碍。

1.一方面原因是,我们对轻微的错误和同步问题非常敏感。在元宇宙中,如果你与你的母亲交谈时,她好像处于100毫秒的延迟状态,那么你很快就会觉得有点恐怖。

2.另一方面原因是,今天很少有服务和应用需要超低延迟交付,这反过来又使致力于提供实时交付服务的网络运营商或技术公司更难生存。

好消息是,随着元宇宙的发展,人们对低延迟的互联网基础设施的投资将会增加。

06

计算,元宇宙的底层逻辑

及时发送足够的数据只是操作同步虚拟世界过程的一部分,此外还必须理解数据,运行代码,评估输入,执行逻辑,渲染环境,等等。而这就是CPU和GPU所要承担的工作,在广义上叫作“计算”。

所有数字工作的执行都有赖于计算。几十年来,我们可以看到每年可用的和制造的计算资源数量不断增加,也见证了它们的强大。尽管如此,计算资源从过去到现在甚至是将来都很可能处于稀缺状态,因为当我们获得了更强的计算能力时,通常就会尝试执行更复杂的计算。这一点从过去40年电子游戏机的平均大小中可以看出来。PS1于1994年发布,重3.2磅,体积为10.75英寸×7.5英寸×2.5英寸;PS5于2020年发布,重9.9磅,体积为15.4英寸×10.2英寸×4.1英寸。这些数值的增加主要是为了增加设备的计算能力,因此在设备工作过程中需要更大的风扇进行冷却。PS1(除了它的光驱)可以塞进钱包,成本低于25美元,但与现代的同类产品相比,人们对这种设备的需求已经很少了。

我在前文提到过皮克斯于2013年为制作《怪兽大学》而建造的超级计算机:将大约2 000台工业级计算机连在一起,总共有24 000个内核。该数据中心的成本高达数千万美元,毫无疑问远远超过了PS3的价格,但它能够拍摄更大、细节更丰富、更精致的图像。总的来说,该电影的120 000帧中每一帧的渲染都需要花上30个内核时间(core hour)。在接下来的几年里,皮克斯用更新和更强大的处理器替换了其中许多计算机和内核,这些处理器可以更快地渲染这些相同的镜头。但皮克斯没有优化速度,而是利用这种能力创建了更复杂的渲染。例如,皮克斯2017年的电影《寻梦环游记》( Coco)中的一个镜头,有近800万束单独渲染的灯光。起初,渲染镜头中的每一帧需要1 000多个内核时间,后来缩减至450个内核时间。皮克斯能够把部分镜头的渲染时间减少到55个内核时间是通过以20度纵向和横向增量来“烘焙”灯光,也就是降低它们对相机的响应。

这样的对照似乎有失公允。毕竟,不是每个渲染都需要800万束灯光或实时渲染,也不会在350平方米的IMAX屏幕上接受审视。然而,元宇宙所需的渲染和计算要复杂得多。它们还必须大约每0.016秒,或者最好是大约每0.008 3秒创建一次!不是每家公司都买得起一个超级计算机数据中心,可以说只有极少数公司买得起。事实上,即使是当下最成熟、最耀眼的虚拟世界,在计算方面也面临着同样的限制。

让我们回到《堡垒之夜》和Roblox上来。虽然这些游戏取得了令人难以置信的创造性成就,但它们的基本思想不是全新的。几十年来,开发人员一直在想象与数十名(如果达不到数百或数千人的话)实时在线的玩家在同一个虚拟环境中共享仅受用户想象力限制的模拟体验,但问题是,目前的技术无法实现这种体验。

虽然自20世纪90年代后期以来,拥有数百甚至数千个并发用户的虚拟世界已经成为可能,但虚拟世界本身和其中的用户都受到严格限制。在《星战前夜》中,玩家无法通过化身聚集在一起,只能指挥大型且大多是静止的飞船在太空中重新定位或交战。

在《魔兽世界》中,数十个化身可以在同一个地方渲染,但模型细节不到位,比例相对较小,玩家也不能很好地控制化身。如果太多玩家聚集在一个区域,游戏服务器会暂时将其“分片”呈现为该空间的并发操作,但副本依然保持独立。有些游戏甚至只对玩家的操作应用实时渲染,其余部分都使用游戏的内置AI,整个背景都是预先渲染的,玩家无法对它产生任何影响。要想参与上述的任何一种体验,还需要玩家花费数千美元购买游戏专用个人电脑,即使购买这样的设备不是绝对必要的。用户可能不得不“关闭”或“降低”游戏的渲染能力或将帧速率减半。

直到2015年左右,数以百万计的消费级设备才能够管理像《堡垒之夜》这样的游戏——一局比赛中有数十个生动逼真的游戏化身,每个角色都可以做多样的动作,并与一个生动且有形的世界,而不是一片广袤冰冷的空间进行交互。值得注意的是,大约在同一时间,出现了足够多价格不算太高的服务器,而且可以管理和同步来自如此多个设备的输入。

这些计算技术的进步使电子游戏行业发生了巨大变化。多年来,世界上最受欢迎(同时创收能力也最强)的游戏往往是那些专注于丰富的用户生成内容和大量并发用户的游戏,比如《自由之火》、《绝地求生》、《堡垒之夜》、《使命召唤:战争地带》(Call of Duty: Warzone)、Roblox、《我的世界》。此外,这些游戏迅速扩展到以前“仅限生活实况”(IRL Only)的媒体体验,比如《堡垒之夜》中特拉维斯·斯科特的演唱会,或利尔·纳斯·X(Lil Nas X)在Roblox中举办的演唱会。在这些新的形式和事件的共同作用下,游戏行业迎来了巨大增长。平均来看,以2021年数据为例,每一天都有超3.5亿人参与大逃杀游戏,而这只是高CCU(并发用户)游戏的一种类型,并且有数十亿人能够参与这样的游戏。2016年,全球只有3.5亿人拥有渲染丰富的3D虚拟世界所需要的设备。Roblox的月活跃用户数在2021年达到巅峰,为2.25亿,这个数字比历史上最畅销的游戏机PS2的终生销量高出1/3以上,是Snapchat和Twitter等社交网络用户数量的2/3。

现在你可能已经猜到,这些游戏远超竞争对手,部分原因是它们运用了特定的设计决策来解决当前的计算限制。大多数大逃杀游戏支持100名玩家同时在线,但它们也使用带有众多“兴趣点”的巨大地图将玩家分散开来。这意味着虽然服务器需要跟踪每个玩家在做什么,但每个玩家的设备不需要渲染他们或跟踪处理他们的动作。虽然玩家最终必须集中在一个小空间内,有时这个空间只有宿舍大小,但大逃杀的设定决定了到那个时候,绝大部分玩家都已被“杀死”了。随着地图的不断缩小,生存也会变得更加困难。大逃杀玩家可能需要提防99个竞争对手,但他们的设备面临的挑战要少得多。

不过,这些技巧能够带来的改变也就到此为止了。例如,只能在移动设备上玩的大逃杀游戏《自由之火》是世界上最受欢迎的游戏之一。但是,它的大多数玩家都在东南亚和南美,而在这些地方大多数玩家用的都是中低端安卓设备,而不是功能更强大的iPhone或者高端安卓设备。因此,《自由之火》中的大逃杀仅限50个玩家同时参与,而不是100个。同时,当《堡垒之夜》或Roblox等游戏在更狭窄的空间,比如在虚拟演唱会现场开展社交活动时,它们会将并发用户减少到50个或更少。与标准游戏模式相比,它们还限制了用户可以做的事情。例如建筑项目可能会被关闭,另外舞蹈动作的数量也会从正常的十几个或两个减少到只有一个预设选项。

如果你的处理器不如其他普通玩家的处理器强大,你会发现必须做出更多妥协。几年前的设备不会加载其他玩家的自定义服装,因为没有相应的游戏玩法需要这样,而只是将它们呈现为定型的角色。虽然《微软模拟飞行》能给玩家带来各种奇妙的体验,人们坐在家里借助计算机就能实现做飞行员的梦想,但只有不到1%的台式机或Mac笔记本电脑和游戏专用个人电脑可以在其最低保真度设置下运行该游戏。《微软模拟飞行》可以在这些设备上运行的部分原因是,除了地图、天气和飞行路线之外,它的世界只有很小一部分是真实的。

当然,计算能力每年都在提高。Roblox现在在其保真度相对较低的世界中支持多达200名玩家,在beta测试版中可能有多达700名玩家。但是,我们距离“想象力是唯一限制”这一愿景的距离还很远。元宇宙的实现,对应数十万人参与共享模拟,并拥有任意数量的自定义虚拟物品,完整的动作捕捉,能够以完全持续的方式高度自主地调整虚拟世界(而不是从十几个选项中进行选择),并且不仅可以以1 080p(通常被认为是“高清”),还可以以4K甚至8K格式渲染该世界。目前即使是地球上最强大的设备也很难按照这样的标准进行实时渲染,因为资产、纹理的增加,分辨率的提高或额外的帧和播放器的添加都意味着要消耗更多稀缺的计算资源。

英伟达的创始人兼首席执行官黄仁勋认为,沉浸式模拟的下一步将远远超越更逼真的爆炸效果或更生动的虚拟化身这一水平。他设想把“粒子物理定律、引力定律、电磁定律、电磁波(包括光)和无线电波……压力和声音”应用到元宇宙中。

元宇宙是否需要如此遵从物理定律是存在争议的。这里的关键问题是,因为计算能力的进步总会带来重要的突破,而突破就意味着需要更多的计算能力,所以计算能力无论如何都是稀缺的。黄仁勋将物理定律带入虚拟世界的愿望似乎很难实现,但是如果这个愿望的确无法实现,就需要预测和排除将物理定律应用在虚拟世界可能带来的创新。谁会想到100人的大逃杀游戏成为现实会改变世界呢?可以肯定的是,计算的可用性和限制将决定对于哪些人来说,在何时何地,怎样的元宇宙体验是可能实现的。

同一问题的两个方面

我们知道元宇宙需要更多的计算能力,但并不知道具体需要多少。在第3章中,我引用了Oculus首席技术官约翰·卡马克的话,他认为“构建元宇宙是出于一种道德责任”。2021年10月,卡马克表示,如果20年前有人问他“如果处理能力变成现在的100倍”是否足以履行这一职责,他会说是的。然而,尽管现在有数十亿台设备具备这种能力,但根据卡马克的观点,保守估计,元宇宙至少还需要5~10年时间才能成为现实,且到时仍将面临“极大的优化和折中空间”。两个月后,英特尔高级副总裁兼加速计算系统和图形事业部(Accelerated Computing System and Graphics Group)主管拉贾·科杜里(Raja Koduri)在英特尔的投资者关系网站上表达了类似想法。科杜里表示:“事实上,元宇宙可能是继万维网和移动互联网之后的下一个主要计算平台……但要实现真正意义上的持续性、沉浸式、大规模且可供数十亿人实时访问的计算,需要满足的条件更多:与当今最先进的技术相比,计算效率需要提升至目前的1 000倍。”

对于如何以最好的方式实现这一目标,人们有不同的看法。

一种观点认为,计算应该尽可能在远程的工业级数据中心而不是在消费级设备上执行。虚拟世界需要的大部分计算在每个用户的设备上单独执行,这对很多人来说都是一种浪费,因为这意味着很多设备为了支持相同的体验需要在同一时间执行相同的操作。相比之下,由虚拟世界“所有者”运营的超级强大的服务器只是跟踪用户输入,在必要时进行中继(relay)处理,然后在过程发生冲突时充当裁判。它甚至不需要渲染任何东西!

我们通过一个例子来展示虚拟世界中发生的相同情景。当玩家在《堡垒之夜》中向一棵树发射火箭弹时,发射的信息(使用的物品、它的属性和弹丸的轨迹)会从该玩家的设备发送到《堡垒之夜》的多人游戏服务器,然后服务器将该信息传递给需要这些信息的所有玩家。随后,本地机器会进行处理并根据该信息执行相应的操作:显示爆炸场景,确定玩家是否受到伤害,从地图上移除树,并让玩家可以穿过树原来所在的位置,等等。

按实际情况来看,玩家看到的爆炸场景有可能各不相同,即使“相同”的爆炸物在“相同”的时间以“相同”的角度击中了“相同”的树,并且应用了完全相同的逻辑来处理因果关系,情况依然如此。这反映了这样一个事实:由于延迟并不是固定的,因此设备接收到的火箭的发送时间有可能稍早或稍晚,并且发射位置稍有不同。大多数情况下,这种差异无关紧要,但有时它会产生巨大影响。例如,玩家1的主机可能会认定玩家2在炸毁树的那场爆炸中死亡了,而玩家2的主机显示玩家2受到了重伤但并不致命。这两个主机都不是“错误的”,但游戏显然不能继续处理两个版本的“真相”,所以服务器必须进行信息“挑选”。

当前对个人设备的依赖也产生了其他限制。用户只能体验他们自己的设备可以管理的内容。2019年的iPad、2013年的PS4和2020年版的PS5呈现《堡垒之夜》的方式是不同的。iPad的刷新率将被限制为每秒30帧(FPS),PS4可以实现60帧,而PS5可以达到120帧。iPad可能只加载选择性的贴图纹理,甚至可能忽略化身的服装;而PS5则可以显示折射光和阴影,这是PS4无法做到的。这反过来又说明虚拟世界的整体复杂性,最终在一定程度上会受到可以访问它的最低端设备的限制。Epic Games目前的规则是《堡垒之夜》中的化身和服装不影响游戏的玩法,但这一规则一旦改变将导致大量用户流失。

远程渲染,谷歌、亚马逊、奈飞将实现元宇宙的成功构建

将尽可能多的处理和渲染转移到工业级数据中心,不仅可以提高效率,对于构建元宇宙也至关重要。目前已经有一些公司和它们提供的服务在这个方向上进行了实践。例如谷歌Stadia和亚马逊Luna的云游戏服务,它们在远程数据中心处理所有电子游戏的玩法,然后将整个渲染体验作为视频流推送给用户的设备。客户端设备唯一需要做的就是播放此视频并发送输入(向左移动、按下X等)——类似于观看奈飞的视频。

这种方法的支持者常用的逻辑是,家庭用电通常是由电网和工业发电厂而不是私人发电机供应的。有了基于云的模型,消费者可以不用再购买消费级、不经常升级和被零售商加价的计算机,而是租用单位处理能力更具成本效益且更易于更新的企业级设备。无论用户拥有一部1 500美元的iPhone还是旧款带电子屏幕并能够连接Wi-Fi的冰箱,他们都可以在上面玩各种计算密集型游戏,比如以最高配的渲染模式玩《赛博朋克2077》( Cyberpunk 2077)。既然这样,为什么虚拟世界要依赖于一小块包裹在塑料染色罩中的消费硬件,而不是建立在那些运营着虚拟世界的公司所提供的服务基础之上呢?这些公司坐拥价值数百万美元乃至十亿美元的服务器堆栈。

虽然这种方法的所有表层逻辑都说得通,同时奈飞和Spotify等公司提供的服务器端内容服务也取得了成功,但远程渲染并不是当今的游戏发行商达成了共识的解决方案。蒂姆·斯威尼认为:“割裂地看待实时处理和延迟,注定是要失败的。因为虽然带宽和延迟在改善,但本地计算性能提高的速度会更快。”换句话说,争论的焦点不是远程数据中心是否可以提供比消费者所有的数据中心更好的体验,因为它们显然可以,重点在于网络阻碍着传输,且这样的阻碍将来会继续存在。

此时,发电机的类比就开始显得不那么恰当了。在大多数发达国家,消费者毫不费力就可以快速获得他们每天需要的电。但电力输送的效率并不高,因此将电力输送与数据传输进行类比就不太恰当了。发送数据时,要推送远程渲染体验,需要实时发送每小时数千兆字节的数据。但我们已经了解到,及时发送每小时几兆字节的数据都困难重重。

此外,远程计算尚未证明自己在渲染方面更高效,这是几个相互关联的问题导致的。

GPU在任何给定时刻都不会渲染大部分虚拟世界,更不用说渲染整个虚拟世界了;相反,它只会在用户需要时渲染所需内容。当玩家在玩《塞尔达:旷野之息》时,任天堂Switch使用的英伟达GPU有效地卸载了之前渲染的所有内容,以支持玩家的新视野。这个过程被称为“视锥剔除”。其他技术包括“遮挡”和“细节层次”。遮挡是指如果玩家视野中的某些物体被另一个物体挡住,则不加载或渲染被挡住的物体。细节层次是指,只有在玩家应该可以看到某些信息的时候才加载它们,比如白桦树树皮的细微纹理。

视锥剔除、遮挡和细节层次解决方案对于实时渲染体验至关重要,因为它们能够让用户的设备将处理能力集中在用户可以看到的内容上。但结果是,其他用户无法“搭载”该用户的GPU进行计算。可能有些人会认为这是一个谎言,毕竟在任天堂64上玩《马里奥赛车》的经历告诉他们,玩家可以将电视屏幕“拆分”成4个,每个屏幕对应一个驱动。即使在今天,《堡垒之夜》也允许单个PS或Xbox将屏幕一分为二,以便两个玩家同时玩。但在这种情况下,相关的GPU支持对多个参与比赛的人同时进行渲染,而不是对所有玩家执行这样的操作。这里的区别至关重要,它要求每个玩家都必须进入相同的比赛和级别,不能提前退出。这是因为设备的处理器只能加载和管理有限数量的信息,并且它的随机存取存储器系统将临时存储各种渲染(比如树或建筑物)数据,以便它可以被每个玩家重复使用,而不是每次都从头开始渲染。此外,每台设备的分辨率或帧速率下降的程度与用户数量成正比。这意味着即使使用两台电视来操作双人模式的《马里奥赛车》,而不是将一台电视分成两部分,每台电视每秒也只能接收一半的渲染像素。

从技术上讲,GPU可以渲染两个完全不同的游戏。顶级英伟达GPU毫无疑问可以支持2D横向卷轴游戏《超级马里奥兄弟》的两种不同模拟,或者同时支持《超级马里奥兄弟》的一个版本以及一个与之类似的低功耗游戏。但是,这不是以高效计算的方式完成的。一个可以按最高渲染规格运行高端游戏A的英伟达GPU,不能以一半的规格甚至1/3的规格运行该游戏的两个版本。它不能像父母辅导两个孩子学习或让他们上床睡觉那样,根据每个游戏的需要以及何时需要来权衡其功率。即使游戏A永远也用不到英伟达GPU既定的全部功率,备用部分也不能被分配到其他地方。

GPU不会生成通用渲染功率,不能像发电厂将电力分配给多个家庭那样在用户之间进行分配,也不像CPU服务器那样可以支持大逃杀游戏中100位玩家的输入、位置和同步数据。相反,GPU通常作为支持单个玩家渲染的“锁定实例”(locked instances)运行。许多公司正在想方设法解决这个问题,但在找到可行的解决方案之前,设计类似于大型工业发电机、涡轮机或其他基础设施的“巨型GPU”,并不能确保渲染功率稳步提升。随着容量的增加,发电机的单位功率通常更具成本效益,但GPU的情况正好相反。简而言之,GPU要想功率翻倍,其生产成本也得翻倍。

因为“拆分”或“共享”GPU存在困难,微软Xbox的云游戏流服务器场实际上是由成堆拆掉外壳的Xbox组成的,每一台为一个玩家服务。换句话说,微软的发电厂实际上只是由一个个家用发电机而不是社区规模的发电机组成的网络。微软可以使用定制的而非以用户为中心的Xbox中的GPU和CPU硬件来支持云实例。然而,要做到这一点,在开发每一款Xbox游戏时,需要让它支持其他型号的Xbox。

云渲染服务器也面临利用率问题。周日晚上8点,克利夫兰地区可能需要75 000台专用服务器,但平均下来每天只需20 000台,周一凌晨4点则只需要4 000台。消费者购买的这些服务器,可能是游戏机或游戏专用个人电脑,这时没人会关注它们是否被使用或是否离线。然而,数据中心的经济考量总会以优化需求为导向。因此,租用利用率低的高端GPU一直都很昂贵。

这就是为什么如果客户提前从亚马逊租用服务器,Amazon Web Services(AWS)会为他们提供更优惠的价格(预留实例,reserved instances)。因为客户已经为服务器付费,他们下一年的访问权限就可以得到保证,而亚马逊则将成本与向客户收取的费用之间的差额收入囊中(AWS最便宜的预留实例Linux GPU,相当于一台PS4,一年的费用超过2 000美元)。如果客户想在需要时访问服务器(竞价实例,spot instances),他们可能会发现这些服务器是不可用的,或者只有低端GPU可用。这里的最后一点是关键所在: 如果解决远程服务器价格高昂问题的唯一方法是使用而不是替换旧服务器,那么我们并没有解决计算资源稀缺问题。

还有一种改进成本模型的方法:让服务器的位置更集中。一家公司与其在俄亥俄州、华盛顿州、伊利诺伊州和纽约等地均设立云游戏流中心,还不如只建设一两个运营中心。随着客户数量和多样性的增加,需求趋于稳定,平均利用率就会提高。当然,这也意味着远程GPU和终端用户之间的距离变远了,延迟也会随之增加。此外,这也不能解决用户之间的距离问题。

将计算资源转移到云上会产生许多新的成本。例如,在数据中心并排运行、始终开机的设备会产生大量的热——远远超过放置在家里客厅书柜中的服务器的总热量,另外,维修、保护和管理这些设备的成本也很高。从流式传输有限位数据到流式传输高分辨率、高帧速率内容的转变也意味着带宽成本的增加。确实,奈飞和其他公司的成本利用率提高了,但它们通常采用的是非实时方式,从附近存储文件的服务器发送每秒少于30帧(不是60~120帧)、分辨率较低的视频(比如谷歌Stadia所做的那样,采用1K或2K,而不是4K或8K分辨率),而不是执行密集的计算操作。

在可预见的未来,我所说的“斯威尼定律”——本地计算的提升将继续超过网络带宽、延迟和可靠性的提升,很可能会成立。尽管许多人相信戈登·摩尔(Gordon Moore)于1965年提出的摩尔定律,即密集集成电路中的晶体管数量大约每18个月会翻一番,但这种增长速度现在正在放缓,而CPU和GPU处理能力继续快速增长。此外,今天的消费者经常更换主要计算设备,导致每两三年面向终端用户的计算就会产生巨大的进步。

去中心化计算的梦想

我们对更多处理能力的需求是永远都无法满足的,在理想情况下,我们希望尽可能靠近用户,至少也得让附近的工业服务器场(industrial server farms)靠近用户,而这总导致一种新的选择:去中心化计算。在消费者手中以及其他众多家庭中,有着这么多功能强大且经常处于未使用状态的设备,我们很自然就会想要开发系统来分享它们大部分空闲的处理能力。

在文化上,关于基础设施集体共享但归私人所有的想法已经很好理解了。任何在家安装太阳能电池板的人都可以将多余的电力出售给当地电网(以及间接出售给他们的邻居)。埃隆·马斯克描绘过这样的一个未来,当你自己不使用特斯拉时,你可以将其作为自动驾驶汽车出租,这比99%的时间都让它停在车库里要好得多。

早在20世纪90年代就出现了使用日常消费硬件进行分布式计算的程序。加州大学伯克利分校的SETI@HOME项目就是一个非常有名的例子,参与该项目的人自愿使用他们的家用计算机来为外星生命的搜索提供动力。斯威尼强调说,他在1998年发布的第一人称射击游戏《虚幻竞技场1》的“待办事项清单”中有一项是“让游戏服务器能够相互通信,这样我们就可以在单个游戏环节中容纳无限数量的玩家”。然而,近20年后,斯威尼承认这个目标“仍然只是个美好的愿望”。

尽管拆分GPU和共享非数据中心CPU的技术处于萌芽状态,但一些人认为区块链既提供了去中心化计算的技术机制,也提供了相应的经济模型。他们的构想是,未得到充分利用的CPU和GPU的所有者将可以通过出让剩余的处理能力来获得某种加密货币作为“报酬”,甚至可能实时拍卖访问这些资源的权限,可以拍卖给那些身负竞标访问权限任务的人,也可以拍卖给那些有能力竞标访问权限的人。

这样的市场能否提供元宇宙所需的大量处理能力?想象一下,当你在沉浸式空间中游览时,你的账号会不断将必要的计算任务分配给你附近的人或者在你旁边走在街上的人所持有但没使用的移动设备,以渲染你的体验,或令你的体验更加生动。稍后,当你不使用自己的设备时,你也会因为出让了它们的计算能力而获得代币(详见第11章)。这种加密交换概念的支持者认为它代表了未来所有微芯片都将具备的特征。每台计算机,无论大小,都将被设计成可随时拍卖空闲周期。数十亿个动态排列的处理器将为大型工业客户的深度计算周期提供动力,并提供终极的、无限的计算网格,使元宇宙成为可能。也许,要想让每个人都能听到树倒下的声音,唯一的方法就是所有人都给它浇水。

THE METAVERSE 透视元宇宙

去中心化计算:若想让每个人都听到树倒下的声音,唯一的方法就是所有人都给它浇水

我们对更多处理能力的需求是永远都无法满足的,在理想情况下,我们希望尽可能靠近用户,至少也得让附近的工业服务器场靠近用户,而这总导致一种新的选择:去中心化计算。

1.在消费者手中以及其他众多家庭中,有着这么多功能强大且经常处于未使用状态的设备,我们很自然就会想要开发系统来分享它们大部分空闲的处理能力。

2.每台计算机,无论大小,都将被设计成可随时拍卖空闲周期。数十亿个动态排列的处理器将为大型工业客户的深度计算周期提供动力,并提供终极的、无限的计算网格,使元宇宙成为可能。也许要想让每个人都能听到树倒下的声音,唯一的方法就是所有人都给它浇水。

07

虚拟世界引擎,元宇宙的建立基础

想象一下这样的场景:一棵虚拟的树在虚拟森林里倒下了。

在前两章中,我解释了渲染树需要什么,如何才能让树的倒下得到系统处理,以及如何让其他在场的用户都知晓。那么在元宇宙中,这棵树是什么?它在哪里?森林又指什么?答案是:它们都是数据和代码。

数据可以描述虚拟对象的属性,例如它的尺寸或颜色等。为了让我们的树由CPU处理并由GPU渲染,这些数据需要通过代码运行。如果我们想砍倒那棵树并把它做成床或用它来生火,那么该代码必须是运行虚拟世界的更广泛代码框架的一部分。

现实世界与虚拟世界其实并不是完全不同。现实世界中的物理定律就是虚拟世界中读取和运行所有交互的代码,这些代码决定了树木倒下的原因、它倒下时如何在空气中产生振动并传入人耳,从而导致神经通过各种突触的电信号传递信息。同样,人类“看到”一棵树,意味着它反射了太阳的光,而这些光又被人眼和大脑接收和处理。

但现实世界和虚拟世界有一个关键区别:现实世界是完全预编程的。我们看不到X射线或回声定位,但与它们相关的信息是存在的。 而在游戏中,X射线和回声定位需要数据和大量代码。如果你在家把番茄酱和石油混在一起,然后试着吃掉它或用它画画,物理定律自然而然就会向你展示既定的结果。但对于游戏来说,要处理这一事件,它需要提前知道番茄酱和石油混合(可能是按通用比例进行混合的)时会发生什么,或者它需要对这两者有足够的了解,以便游戏的逻辑在游戏能力允许的范围内能够理解这个过程。

虚拟世界的逻辑可能是石油不能与任何东西混合,抑或它只能与石油混合。要是它与任何其他东西混合,只会产生无法使用的污泥。但要得到更复杂的结果,需要更多的数据,并且虚拟世界的逻辑变得更加严谨。添加多少石油才会让番茄酱无法食用?添加多少番茄酱才会让石油无法使用?将两种物质按一定的比例混合,所得物质的颜色和黏度会发生怎样的变化?

事实上,如此多的组合方式在现实世界几乎没有价值,然而这对那些虚拟世界的建设者来说却有莫大的意义。因为《塞尔达传说》的英雄不需要去太空,所以不需要空间物理学。《使命召唤》的玩家不需要皮筏艇、魔法或烘焙食品,游戏的开发者就没有编写相关代码。任天堂和动视暴雪可以根据它们的虚拟世界的特点有针对性地分配数据、编写代码,这种做法会给它们带来更多益处,它们不会采用对游戏来说实用价值有限的无限组合。

尽管效率很高,但这种方法给构建类似元宇宙的虚拟世界带来了阻碍,尤其是在构建互操作性方面。例如,在《微软模拟飞行》中,飞行员可以将直升机降落在橄榄球场旁边,但他无法观看橄榄球比赛,更不用说加入比赛了。微软要想提供这样的功能,需要从头开始构建自己的橄榄球系统,然而其实许多开发人员已经在做这样的工作了,并且由于积累了多年的经验,他们可能比微软更擅长做这件事。虽然《微软模拟飞行》可以尝试把别的公司开发的橄榄球系统集成到这些为橄榄球比赛特别设计的虚拟世界中,但各方的数据结构和代码可能不兼容。在第6章中,我提到了用户设备经常执行相同的操作这一事实,相比较而言,开发人员面临的情况更糟糕,他们需要不断地打造和重建从橄榄球场到关于橄榄球的一切,甚至是橄榄球在空中飞行时的规则。更重要的是,随着虚拟世界建设者希望利用的CPU和GPU变得越来越精密复杂,这项任务的难度也在逐年增长。全球大型电子游戏发行商Nexon的数据显示,《塞尔达传说》或《刺客信条》( Assassin’s Creed)等开放世界动作游戏的平均制作人员数量从2007年的约1 000人增长到2018年的4 000多人,预算增至最初的10倍,开发速度大约为之前的2.5倍。

听到树倒下的声音,且让它们倒在橄榄球场附近,同时将它们倒下的声音融入人群为比赛的触地得分而发出的欢呼声中,这需要大量程序员以同样的方式编写大量代码来处理大量数据才能实现。

既然我们已经介绍了共享、运行和渲染元宇宙所需的数据,以及代码所需的网络和计算能力,现在就可以对后面的这些概念进行讨论了。

游戏引擎,驱动宇宙虚拟法则

我们已经了解到,元宇宙的概念、历史和未来都与游戏密切相关。如果你去查看虚拟世界的基本代码,可能就会对这一事实有更清晰的认识,该代码通常包含在“游戏引擎”中。游戏引擎是一个定义比较宽泛的术语,指的是有助于构建游戏、渲染游戏、处理其逻辑和管理其内存的技术及框架包。简而言之, 我们可以将游戏引擎视为建立宇宙虚拟法则的事物,它定义了所有交互和可能性的规则集。

Epic Games与Unity Technologies,虚幻引擎的引领者

从历史角度看,所有游戏开发商都构建和维护自己的游戏引擎。但在过去15年里,人们见证了另一种选择的兴起:从制造虚幻引擎的Epic Games获得引擎授权,或从制造Unity引擎的Unity Technologies获得授权。

使用这些引擎是要支付一定费用的。例如,Unity Technologies会向每个使用Unity引擎的游戏开发者收取年费,这笔费用为400~4 000美元,具体费用取决于开发者所需的功能和开发者公司的规模;而Epic Games通常收取净收入的5%。当然,这两家公司开发属于自己的引擎并不只是为了收费。一些开发人员认为,为特定的游戏类型或体验,如写实和快节奏的第一人称射击游戏开发引擎,可以确保他们的游戏“感觉更好”或表现更好。也有人认为,依赖其他公司的技术和受其优先项的影响是值得担忧的,另外,这些引擎“供应商”对自己的游戏及其表现有如此详细的了解也同样令人忧虑。基于这些考量,大型游戏发行商建造和维护自己的引擎变得越来越常见,比如动视暴雪和史克威尔·艾尼克斯(Square Enix)竟然至少分别运行着6个引擎。

然而,大多数开发人员都看到了使用和自定义虚幻引擎或Unity能带来高额的净利润。通过获得授权的方式,一个小型或缺乏经验的团队可以使用功能更加强大且经过了广泛测试的引擎来打造游戏,这是他们以往所不具备的,而且失败的可能性更小,且永远不会超出预算。此外,他们可以将更多的时间花在设计构建与众不同的虚拟世界上,比如关卡设计、角色设计、游戏玩法等,而不是把时间花在搭建基本的运行环境上。与其雇用开发人员,培训他们使用或开发专有引擎,倒不如直接招募数百万已经熟悉Unity或虚幻引擎的个体开发人员立即着手游戏的开发工作。也正因为如此,游戏公司集成第三方工具更容易。例如,一家为电子游戏化身制作面部跟踪软件的独立初创公司,在设计解决方案时,不会依赖它们从未使用过的专有引擎,而是使用大多数开发人员都在用的引擎。

将设计比作建造房屋十分贴切。建筑师和装潢师都没有专门去设计木材尺寸、装配硬件、测量系统、蓝图框架或工具等。这使得他们不仅可以将更多精力花在创造性工作上面,而且雇用木匠、电工和管道工做相应的工作也变得更轻松。如果房子需要翻新,其他团队可以更轻松地修改现有结构,因为他们不需要学习新技术、新工具或新系统。

然而,这个类比有一个致命的缺陷。因为房屋一般只在一个地方建造一次,而游戏在设计时就考虑到了要在尽可能多的设备和操作系统上运行,其中一些还是尚未开发更谈不上发布的设备和系统。因此,游戏必须兼容不同的电压标准(比如,英国的电压为240伏,美国的电压为120伏)、测量系统(英制和国际制)、惯例(空中缆线和埋地缆线)等。Unity Technologies和Epic Games建造和维护它们自己的游戏引擎,一方面是为了让这些引擎可以与每个平台兼容,另一方面是为了针对每个平台进行优化。

从某种意义上说,我们可以将独立游戏引擎视为行业共享的研发池。确实,Epic Games和Unity Technologies是营利性公司,因此开发者不必投入部分预算开发专门的游戏引擎管理核心游戏逻辑,一些跨平台技术提供商可以将部分预算集中用于开发一个功能更强大的引擎,以支持整个生态系统并从中获益。

随着大型游戏引擎的发展,一种新型的独立游戏解决方案出现了,它就是实时服务套件。PlayFab(现在归微软Azure所有)和GameSparks(归亚马逊所有)等公司运营着虚拟世界“运行”在线和多人游戏体验所需的大部分内容。这些内容包括用户账号系统、玩家数据存储、游戏内交易处理、版本管理、玩家间通信、匹配、排行榜、游戏分析、反作弊系统等,所有这些都可以跨平台工作。Unity Technologies和Epic Games现在也都有自己的实时服务产品,这些产品的成本很低,而且适用范围并不局限于它们自己的引擎。Steam作为世界上最大的PC游戏商店(第10章将重点讨论),也提供了自己的实时服务产品Steamworks。

随着全球经济不断向虚拟世界转移,这些跨平台、跨开发者的技术将成为全球社会的核心组成部分。特别是下一批虚拟世界建设者——不是游戏开发商,而是零售商、学校、运动队、建筑公司和城市,它们极有可能会使用这些解决方案。Unity Technologies、Epic Games、PlayFab和GameSparks等公司可以说是站在了令人十分羡慕的位置上。最明显的体现是,它们成为虚拟世界的一种标准特征或通用语,它们就像是元宇宙中的“英语”或“国际制”。就像你在世界各地旅行时可能会使用英语和一些国际制单位一样,如果你今天在网上构建一些东西,不管你正在构建什么,你正在使用和购买的都是这些公司推出的一个或多个产品。

但更重要的是,说到在虚拟世界建立通用数据结构和编码规范,有谁能比管理着这套逻辑的公司更有发言权呢?说到这些虚拟世界之间的信息、虚拟商品和货币交换,有谁能比在这方面起促进作用的公司做得更好呢?如果类比互联网名称与数字地址分配机构(ICANN)在Web域和IP地址方面所做的贡献,那么在创建虚拟世界的互联网络方面,又还有谁比得上管理虚拟世界的逻辑的公司呢?我们稍后再来探讨这些问题和这个假定的答案,在此之前我们需要来探讨一下一些人所认为的构建元宇宙更简单、更好的路径。

虚拟世界集成平台

随着独立游戏引擎和实时服务套件在过去20年的发展,Roblox、Epic Games等公司将这些经验组合成了一个新的模式:虚拟世界集成平台(Integrated Virtual World Platforms,IVWP),比如Roblox、《我的世界》和《堡垒之夜》创意模式。

IVWP,创建虚拟世界的新模式

IVWP一般是以自己的通用、跨平台游戏引擎为基础建立的,这些游戏引擎类似于Unity和虚幻引擎(Epic Games的《堡垒之夜》创意模式就是使用Epic Games自己的虚幻引擎构建的)。它们的设计使得在操作过程中不需要实际“编码”,游戏、体验和虚拟世界是根据图形界面、符号和具体目标构建的。我们可以将其视为使用基于文本的MS-DOS(微软磁盘操作系统)和使用可视化iOS之间的区别,或者将其视为使用HTML设计网站与使用Squarespace创建网站之间的区别。IVWP界面使用户能够以更少的人力、更少的投资、更少的专业知识和技能,更轻松地创建自己想要的虚拟世界。例如,Roblox平台上的大多数创作者都是青少年,已经有近1 000万用户在Roblox平台上创建了虚拟世界。

此外,在这些平台上构建的每个虚拟世界都必须使用平台的整个实时服务套件,包括其账号和通信系统、虚拟化身数据库、虚拟货币等。这些虚拟世界全部必须通过IVWP访问,因此它充当着一个统一体验层的角色,它也是独立的安装程序文件。从这个意义上说,在Roblox上构建一个世界更像是构建一个Facebook页面,而不是一个Squarespace网站。Roblox甚至为开发者运营一个综合市场,在那里他们可以上传他们为自己的虚拟世界定制的任何东西,比如,一棵圣诞树、一棵被雪覆盖的树、一棵枯树,以及松树皮纹理等,并将其授权给其他游戏开发者。这为开发者提供了新的收入来源(开发者对开发者,而不仅仅是开发者对玩家),同时其他人也能以更低的成本,更容易、更快地构建他们的虚拟世界。此外,该过程还推动了虚拟对象和数据的进一步标准化。

尽管开发人员使用IVWP构建虚拟世界比使用虚幻引擎或Unity等游戏引擎更容易,但构建IVWP本身比开发游戏引擎更难。为什么?因为对于IVWP而言,一切都是需要优先考虑的事项。IVWP希望创作者能够灵活地创作,同时还能将底层技术标准化,从而最大限度地提高它们所构建的一切内容之间的互联性,并最大限度地减少创作者对培训或编程知识的需求。这就好比宜家想要建立一个充满活力的国家,但要求所有建筑物必须使用宜家预制件一样。此外,宜家将负责这个新国家的货币发行、公共事业,以及设立执法机构和海关等。

《第二人生》前首席执行官艾比·阿尔特伯格(Ebbe Altberg)给我介绍了一个了解IVWP操作难度的好方法。在2015年前后,该平台的一位开发人员创建了一项销售虚拟马和订购虚拟马饲料的业务。后来,《第二人生》升级了自己的物理引擎,但其中的一个漏洞导致每当马想吃饲料的时候总是会从饲料上面滑过去,吃不着,结果马就被饿死了。《第二人生》甚至没能第一时间发现并修复这个漏洞,同时为受影响的人提供适当的补救措施又花了更多时间。不得不承认,此类事件会扰乱《第二人生》中的经济秩序,同时用户也会对市场产生不信任,从而损害买卖双方的利益。找到一种可以不断改进功能,同时继续支持旧的设计且没有错误的方式,是一项非同寻常的任务。游戏引擎也在一定程度上面临着这个问题。但是,当Epic Games更新虚幻引擎时,每个开发人员都可以部署此更新,并且他们可以在经过大量测试后选择部署时间,也不必担心该更新会对他们与其他开发人员的交互产生影响。当Roblox推送更新时,它的所有虚拟世界都会同步更新。

同时,“虚拟宜家”是通过编程构建的,而不是用现实世界的建筑材料构建的,这意味着它的发展不受物理规律的约束,而是具备软件所特有的几乎无限的潜力。由Roblox公司或其开发人员在Roblox中制造的任何东西都可以无限次重新利用或复制,不会产生边际成本,而且可以进行改进。IVWP中所有开发人员的有效协作让虚拟世界和虚拟对象的网络能够不断扩展且功能越来越强大。随着这个网络的持续改进,它越来越容易吸引更多的用户,每个用户在这里花的钱会更多,这样一来网络收入也会随之增加,然后会吸引更多开发人员和投资,如此一来网络又会得到进一步的改善。协作研发的好处不仅体现在游戏引擎上,还体现在对所有内容的研发上。

实际情况是怎样的呢?目前《堡垒之夜》的创意模式由Epic Games管理,这意味着它仍然是私有的,同时《我的世界》的财务状况没有被其所有者微软公开,相比之下Roblox公司目前是表现最好的。

我们先看参与度。截至2022年1月,Roblox平均每月使用时间超过40亿小时,高于一年前的约27.5亿小时、两年前的15亿小时和2018年底的10亿小时。这还不包括用户在YouTube上观看Roblox相关内容的时间。作为世界上最常用的视频网站之一,YouTube的报告显示,游戏内容是其最受关注的内容类别,而Roblox的内容关注度排名第二(排名第一的也是一个IVWP——《我的世界》)。相比之下,奈飞每月的使用时间为125亿~150亿小时。所有顶级Roblox游戏,比如 Adopt Me!、《地狱之塔》(Tower of Hell)和《米普城市》(Meep City),都是由几乎没有经验的独立开发者,以及由10~30人组成的小型团队(团队成立之初通常只有一两个人)开发的。迄今,已经有150亿~300亿人次玩过这些游戏。这些顶级Roblox游戏的单日玩家数量是《堡垒之夜》或《使命召唤》的一半,也是《塞尔达传说:旷野之息》或《最后生还者》( The Last of Us)等游戏的全部玩家数量的一半。那么虚拟物品在平台内的发展情况如何呢?仅2021年就有2 500万种商品被制造出来,玩家共计获得或购买了58亿件虚拟物品。

Roblox激增的参与度部分是由其不断增长的用户群推动的。从2018年第四季度到2022年1月,月活跃用户数从估计的7 600万增加到超过2.26亿(增长了约200%),而日活跃用户数从约1 370万增加到5 470万(增长了约300%)。你也许会注意到,日活跃用户数的增长幅度超过了月活跃用户数,同时参与度的增幅更大(400%)。Roblox不仅整体上变得越来越流行,它也越来越受用户欢迎。我们可以在其财务报告中看到Roblox网络效应的类似证据。从2018年第四季度到2021年第四季度,Roblox的收入增长了469%,而它为平台上的虚拟世界建设者(即开发人员)支付的报酬增长了660%。换句话说,Roblox的用户平均每小时的花费比以往任何时候都多,平台的创收速度也比以往任何时候都快,并且这两个指标的增长速度超过了令人惊叹的用户增长速度,而这都不及支付给开发者的报酬的增长速度。此外,Roblox增长的用户中,年龄较大的用户占绝大多数。截至2018年第四季度,60%的日活跃用户年龄在13岁以下。3年后,这一比例仅为21%。换句话说,截至2022年1月,在Roblox的用户群体中,13岁以上的用户人数几乎是2018年13岁以下用户人数的5倍多。返回搜狐,查看更多