当前位置:首页 > 区块链快讯 > 中国区块链论文首次入选国际顶会 创新工场发布扩容方案打破区块链“不可能三角”

中国区块链论文首次入选国际顶会 创新工场发布扩容方案打破区块链“不可能三角”

admin3个月前 (09-03)区块链快讯174
创新工场名为异步共识组Monoxide的区块链扩容方案将现有算法性能提升千倍以上,在医疗卫生、智慧城市、征信系统、食品安全等领域大有可为,据称有望掀起堪比深度学习的技术革命。

2019年4月29日,创新工场在北京正式发布一项区块链技术的创新研究成果,由创新工场执行董事王嘉平博士为第一作者与汪浩博士共同发表的论文《Monoxide: Scale Out Blockchain with Asynchronized Consensus Zones》闯入国际计算机网络顶级学术会议NSDI 2019。 

去年12月,NSDI宣布录用该研究论文。该论文提出名为异步共识组Monoxide的区块链扩容方案,可以在由4.8万个全球节点组成的测试环境中,实现比比特币网络高出1000倍的每秒事务处理量,以及2000倍的状态内存容量,有望打破“不可能三角”这个长期困扰区块链性能的瓶颈。

这是国际主流学术界首次认可区块链扩容方案的相关研究,是该会议今年录取的唯一一篇与区块链相关的论文,也是区块链领域中国入选的第一篇文章。

近年来,区块链技术蓬勃发展,大有变革整个在线数字世界的气势和雄心。

从2008 年“区块链之父”中本聪发表论文《Bitcoin: A Peer-to-Peer Electronic Cash System》至今的十余年间,全世界最聪明的学者、开发者投身于这一领域的研究上面,前赴后继地出现了各种致力于提高区块链系统性能的项目。

不过,处于高速前进中的区块链技术却长期面临着一个著名的“不可能三角”技术瓶颈。也正是因为这个问题,区块链技术至今仍然无法在各领域内发挥出它的全部潜能。 

这里的区块链“不可能三角”也称“三元悖论”,指区块链网络模型无论采用哪种共识机制来决定新区块的生成方式,都无法同时兼顾性能、安全、去中心化这三项要求,只能满足其中两项而牺牲另外一项,最多三者取其二。 

王嘉平博士原为微软总部雷德蒙研究院主管研究员,专注分布式系统、计算机图形学和视觉以及用于机器学习的GPU集群等领域的研究,有数十项研究成果发表于ACM SIGGRAPH/ToG顶级国际期刊,已授权的美国专利十项余项。他师从沈向洋博士(现微软全球执行副总裁),在中科院计算所获得博士学位,其博士论文获得2009年度全国百篇优秀博士论文奖,是该年唯一一名计算机科学专业的获奖者。 

创新工场执行董事王嘉平 

王嘉平博士现任创新工场执行董事,投资方向为区块链和人工智能,曾主导了对比特大陆的首轮机构投资,成为其首轮三大主要投资方之一。 

值得一提的是,论文的两名作者,王嘉平博士与汪浩博士均毕业于中国科院计算所,中科院计算所也是这篇论文的联合署名单位之一。未来,创新工场也将与中科院计算所展开更深入的技术和产业合作。

一、中国区块链技术论文首次入选国际顶会

这是在区块链领域,中国人入选国际顶级会议的第一篇文章。 

NSDI全称Networked Systems Design and Implementation,是 USENIX 旗下的旗舰会议之一,也是计算机网络系统领域久负盛名的顶级会议。 

与其他同领域的顶级学术会议相比,NSDI更加侧重于网络系统的设计与实现,注重系统的性能和伸缩性,大名鼎鼎的大数据系统Spark就曾发表在 2012年的NSDI大会上面。                             

一直以来,NSDI以重视文章质量著称,采用严格的双盲评审,每篇文章都要经过两轮总计六到八个审稿人审阅,之后还需经过程序委员会的讨论筛选。通常,每届会议录用20多篇论文,录取率仅在25%左右。 

NSDI关注的研究课题是计算机网络和分布式系统,区块链的核心技术就属于这个领域。可是事实上,学术界目前在这个领域的主流研究方向还是关注于中心化的数据中心、超算中心里的理论挑战和实际工程问题,对应的大多是云计算行业和涉及大量计算任务的机器学习领域。 

此次,王嘉平博士与汪浩博士共同发表的论文《Monoxide: Scale Out Blockchain with Asynchronized Consensus Zones》闯入NSDI 2019,是国际主流学术界首次认可区块链扩容方案的相关研究,是该会议今年录取的唯一一篇与区块链相关的论文,也是中国入选区块链领域的第一篇文章,可谓是“中华之光”。 

二、打破不可能三角,意义堪比深度学习技术突破之于AI 

受到“不可能三角”的制约,早期的区块链网络通常是单链形式,为了兼顾安全性与去中心化,不得作出性能方面的牺牲—— 

如果把区块链网络处理任务的进程,类比成人们去售票大厅购买车票的过程,那么单链区块链就可以看作是整个售票大厅只有一个售票窗口,所有前来买票的人全部要在这个窗口外排队,于是这个售票大厅的卖票速度可想而知,在单位时间内卖出的车票数目自然也不甚理想。

而Monoxide模型的出现则打破了这一瓶颈,在满足安全、高性能和去中心化的三角特性前提下,尽量不引入额外的实体,不引入额外的机制。 

那么,这是如何实现的呢? 

首先,用多链取代单链,换句话说,为售票大厅增设窗口。 

事实上,此前也有一些研究尝试多链模型,但是孤立工作,无法协同,无法真正发挥“多链”的潜能。 

可以理解为,售票大厅增设多个窗口,但是一个目的地仅对应一个窗口。也就是说,前来卖票的人在“不对口”的窗口无法成功买票,而是需要根据目的地去对应的窗口买票。这意味着,同一时间内,有些窗口前会排起长队,而有些窗口前可能空无一人,整个售票大厅在单位时间内卖出的车票数目仍然有限,卖票效率仍有很大的提升空间。 

Monoxide网络是一个并发的多链系统,每一个链称为"共识组",是其精髓所在。 

具体来讲,共识组是由多个同质的、功能上完全一致、地位上也完全平等,并逻辑上尽量隔离的独立共识系统的实例所构成,它们并行工作,分摊全网的吞吐、计算、存储的压力,分摊全网状态的维护工作。由于共识组之间完全并行、异步也无需锁定和同步,所以即便某一个共识组发生拥塞也不会干扰其它共识组的吞吐和出块。 

如此一来,在上面所描述的售票情景中,前来售票大厅买票的每一个人,无论在哪个窗口都可以直接买票,不同窗口的售票员会在后台协同发挥作用,使单位时间内卖出的车票数目最大化。 

反应在性能上面,区块链的吞吐量和容量将有大幅提升,即单位时间每个窗口卖出的票数与单位时间售票大厅容纳的人数明显增加。 

实验证明,Monoxide模型可以将一个现有的单链共识算法,横向扩展1000倍以上,从而使吞吐量提升1000倍以上,同时也将全网计算能力(CPU)提升2000倍以上,将状态表达的内存空间提升2000倍以上。 

理论上,横向扩展的倍数上限甚至能够达到10万量级。这一研究成果,无疑为区块链技术的发展带来质的飞跃。 

王嘉平透露,2019年8月,Monoxide将上线测试网络,供开发者做技术评估。 

三、落地应用指日可待,将赋能金融支付、医疗卫生、智慧城市等实际场景 

一直以来,区块链技术的应用与普及都备受关注。 

由于这项技术在效率提升、安全保护等方面存在巨大潜能,越来越多的行业开始认识到区块链的力量并逐步尝试落地。 

而Monoxide异步共识组系统的提出,则让区块链技术向实际落地应用又迈进了一步。 

互联网发展至今,任何一个实实在在的在线应用,都是需要承载日常大量的访问和操作以及记录大量用户的状态和信息。这导致,任何一项区块链技术的落地应用,都要求区块链技术本身有能力承载这样的流量和用户体量。这就是为什么区块链技术本身的性能对应用的切实落地至关重要。 

Monoxide异步共识组系统在丝毫没有牺牲去中心化特性实现了性能提升,每一个全节点的工作压力(带宽、计算、内存、磁盘IO)并没有伴随全网横向扩展提升而显著加大。如此一来,就能够保证让一台普通中档价位的电脑轻松地作为网络的一个全节点,通过普通家用宽带网络接入主网,为推进区块链技术的落地进程作出重要贡献,意义重大。 

例如,过去在金融支付领域,受到货币兑换、手续办理等因素的制约,跨国支付往往需要花费较高的时间成本,难以高效完成。而在具有公开、不可篡改属性的区块链技术的帮助下,交易双方的信用机制将得到保障,并且大幅提升系统的运转效率,降低业务成本,能够有效推动跨境支付在商业领域中的发展。 

同理,区块链技术在银行清算、供应链管理、商品防伪溯源等领域也大有可为,甚至有机会带来颠覆式的改革。 

另外,在以海量数据为支撑的人工智能领域,区块链技术的潜能也有极大的施展空间。 

数据安全是人工智能行业内的热门话题和痛点之一,区块链技术凭借自身的去中心化、匿名化等特点,不仅能够确保领域内数据共享的安全性及私密性,还可以避免数据孤岛情况的发生。这种区块链技术与人工智能技术的有机结合,可以为智慧城市、医疗卫生、食品安全等领域提供更多可能性。 

以下为王嘉平在2019年4月29日新闻发布会上的主题介绍和媒体问答实录: 

主题:高性能区块链系统

时间:2019年4月29日  10:30

地点:创新工场深度学习 

创新工场执行董事王嘉平与NSDI会议主席Jay Lorch

王嘉平:我是嘉平。我之前在中科院计算所读博,当时微软亚洲研究院的沈向洋院长是我的导师,同时也先后在微软亚洲研究院和微软总部工作,一直是做技术研究方向的事情。从微软离开以后,开始跟开复那边学习做投资的事情,也帮开复看一下AI领域当中投资需要评估投资者的技术、团队。这是我大概的背景。

我在微软亚洲研究院做的是跟GPU图形学相关的,到了美国就慢慢迁徙到为AI平台做一些计算基础设施的事情,那个时候就转到了分布式计算、并行计算这一块,跟区块链的技术非常相关。因为我本身是中科院计算所毕业的,我们跟中科院计算所那边有很多合作,那边对口的就是我的同学。这次的工作,我们跟计算所也有很多交流和沟通,后面会进一步跟他们一起合作,论文的另一位作者汪浩也是计算所的毕业生。

我先大体介绍一下。今天会从几个角度。一方面我们这边深挖区块链的技术,有来自于我们对区块链这个新技术的掌握,我们了解到它能够在未来不同的场景中有很多应用,这个应用未必是大家耳熟能详的。这篇论文发表在国际计算机网络顶会上,之前有很多互联网领域工作,比如大数据,spark,那是非常著名的大数据分析系统,都是在顶会上面发表。

我们先从区块链这件事情开始。现在是一个云服务时代,全球信息那么多。我们平时依赖于像搜索引擎给我们的网页、推荐系统,包括信息流的推送,我们依赖于这些系统把这些事情告诉我们,这些事情会左右我们去看到一些什么东西,我们会得到什么内容,是这些内容,而不是那些内容,甚至每个人都不一样,这些服务系统背后有很多规则,这些规则是人建立的,但是机器严格的执行它。但是问题是现有的服务系统,加上人工智能的加持,这些计算所构建出来的规则更加强大。其实有很多计算,意味着是规则,如果我们往前看,最初计算很简单,计算就是完成任务,计算过程全部掌握在用户手上,从大型机时代到PC时代,那时候更关注交互,计算速度。自从有了整个网络以后,这件事不一样。从当时的WBE时代走到现在的时代。现在计算,尤其是在云服务体系当中,规则是计算里面最核心的部分。我们日常使用的很多服务,背后都是被这些所驱动。比如做网页上面的推荐或者信息流,很多很多事情,比如你打个滴滴,是服务的撮合,你并不知道这些规则的背后是为我们服务,还是为服务的提供商谋取更多的利润,事实上这两点都有。这些规则对我们来讲并不透明,并且可以悄悄的发生改变,尤其是在线服务已经发生到这么大的规模,影响到所有的人,这件事情需要我们大家关注。

这件事情之所以可以这么做,它是有一个本质的原因。因为现在在线服务系统最初源自于这样一个基于服务器的计算范式,服务器的逻辑是说所有的计算都在我的数据中心发生,它隐含了两件事情,一是说这个计算过程完全由我控制,规则由我制定。就意味着我可以完全掌控这件事情,并且可以随时改变里面的规则,这是现在基于服务器的计算式发生的所有的事情,这个事情开始的非常早,从最初有web服务器时代就开始了,一直演化到现在,当时的服务器是一台计算机,现在大的在线服务商背后是几千几万台服务器在做计算,服务每个人,了解每个人的喜好,针对性的去优化他们的服务质量,或者是优化他们的业务流水。一方面是说这个计算过程,我们用户是完全没有办法掌握,当年全球最大的搜索引擎公司说我们不作恶,那是因为他可以作恶,这件事情才会成为他的slogan,同时正是因为这种范式,是用户隐私问题的根源。这些计算过程必须在服务商的计算机里面发生,导致了它有一个非常天然的理由,这些用户数据都要到我这边来,给他们一个非常好的冠冕堂皇的理由,你们这个数据都要到我这边来,大量收集用户的公开数据和隐私数据,这是在这个计算范式下发生的事情。

大家看到区块链有数字货币,但是区块链的本质并不是数字货币这件事情,区块链提出一种全新的计算范式,这个计算范式是什么呢?它让这个系统里面的规则在全网公开透明,并且这个规则一旦布施以后没有办法偷偷的改变。如果大家约定好我们认可一种新的规则,那也是可以改变的。从计算的架构来讲,它不像前面有一个服务器,什么都在我家里。在前面一个时代,计算是在这边完成,我只把结果告诉你。在区块链新的计算方式当中,首先每一个用户的结点上面,都有一份完整的规则,它知道这个计算应该怎么完成,它知道这个计算怎么样去拿这些输出输入,就意味着当一个规则运行在这个网络里面的时候,规则一旦被部署,所有人参加进来,任何人都没有办法在这个计算的过程中去篡改规则,因为大家都知道这个规则,你改了,你做了这个计算,这个计算结果不会被大家承认。使得在这样一个新的计算范式下面,有一些独特的能力。

我们深入讲一下区块链之所以能够这件事情的原因,因为在区块链里面,它的计算过程一次一次的,不是停留在一台特定的计算机里面完成,它的计算过程一次一次是被全球不同的计算机接力完成。这件事情从本质上就改变了原来的方式,原来的计算是在家我完成,这些硬盘都是我控制的,CPU上应该装载什么样的代码,都是我控制了,意味着我对上面的计算过程,计算的结果都有绝对的控制。但是在区块链的技术下,首先计算过程不是在一个单独的、特定的计算机上面完成,就意味着我们没有办法通过掌握这些计算设备来掌握计算过程,这是区块链最本质的事情。在这个接力计算过程中,图中黄线,比如说第一步的计算可能是在这个结点,第二步就到另外一个结点,跳来跳去,在跳转的过程中,我们没有办法预测下一次计算会在哪个结点完成,但是它有基于P2P网络协议把数据或者计算的结果过程同步到整个网络上,大家都能看到。这是区块链技术的本质。

现在大家看到比特币,只是这个技术支撑的应用而已。这个技术本质给出一个前所未有的能力,这个能力是以前所有的计算技术都没有办法达成的。我自己作为一个技术人,我看一个新的技术出来,看它到底有没有价值,归根到底是说这个技术是不是有一些新的能力,是以前的计算技术没有办法做到的。如果你真的是做了以前没有办法做到的事情,你一定会有潜力,一定会能找到以前因为这些技术的缺失而没有达成的新的业务,没有被满足的需求。这部分前所未有的能力,是实实在在的技术突破。这就意味着在业务场景可以非常完备的数字化和形式化的前提下,计算可以构建一个不为人为因素所控制的,牢不可破的规则,并且可以使得这个规则被严格执行。因为在这个技术之前,我们人类制定了很多规则,花很多精力,监管也好,事后处罚也好,努力使得这个规则被严格行。但是这件事情很难得到完全保障,因为里面是人在参与其中。但是区块链至少在一定的限定范围内,这些相关的规则能够完全被数字化和形式化,有了这个前提,区块链就可以使得这个规则被严格执行,没有人能够篡改。正因为这种技术的独特性,区块链会支撑未来新的这些业务和应用。整个行业大家都在找区块链应用市场。

当下区块链这个技术有比较明显的一个技术层面的问题,它会有一个性能问题。在区块链系统当中,要求每一个参与的计算机都同步整个网络里面的状态和信息,就意味着这个网络本质上被要求能够被装在一台电脑上,因为每一台电脑都在重复拷贝所有的事情。这个架构相当于它企图用一台计算机装下整个世界的业务,就导致所有的区块链系统全网的性能实际上只有一台计算机的通讯能力和计算,包括储存,就是为什么比特币这么慢,这是本质原因。我从计算机的背景来看,这件事情问题在这里。它的解决方案也是挺显而易见的,因为工作量很大,我们其实已经有那么多计算机,干吗非要让所有的计算机重复所有的工作,是不是可以分一分,把整个网络的工作量分一分,分片,用不同组的计算机去参与分片的工作,这是一个大体上的思路。分而治之的思路,在互联网的发展历程当中,大量的被使用,而且这些技术在互联网当中,一次次的为互联网系统的性能提升做出了卓越的贡献。

举几个例子,比如分布式计算系统,这是当时大数据系统当中数据量非常大的,一台机器根本没有办法去计算和存储,它有一个很好的方法把所有的工作量,储存数据和其相应的计算切成好几块,比如切成一万块,让一万台电脑一起算。这个叫做伸缩性。伸缩性的意思就是说它并不是把一件事情的工作量变小,工作量摆在那里不可能变小,但是伸缩性的意思是说我可以把这个工作的事情切分成好多块,让很多计算机参与进去,所以我不需要去打造一台非常巨大的计算机,我可以用平时普通的标准SKU买到的这些计算机把它堆积到一起,他们可以一起工作来完成一个非常巨大的工作量,这是所谓的伸缩量。在我们的论文里就提出了(异步共识组)概念,把整个网络的共识和计算分成好几个组,分开执行,它们互相独立,并行工作,去分摊网络里一部分工作量,包括储存、通讯、内存里面的计算,全部分开来做。这个思路听起来挺直接的,但事实上在区块链系统里面,要完成这样一个设计,并且可以保证它的安全,同时保证原来公平开放的特性,是非常有挑战的。因为相比原来互联网,互联网技术比较容易,都是在内部部署的,不需要考虑里面有恶意的结点,因为内部部署可能电脑会坏掉,但是不会捣乱,不会干坏事。互联网讲究容错,允许机器失效,突然当机了。但是在区块链系统当中,因为它是公平开放的,任何人都可以参与进去,就意味着它不仅仅是需要容错,同时还要保证安全,这就意味着他有能力抵挡在这个网络当中某些结点是恶意的,会干坏事,能够通过协议,通过密码学,通过共识技术,能够阻挡得了少量的恶意结点的出现,这是在区块链系统当中实现分而治之设计思路比较挑战的地方。

当然了,我们做到了这个事情。论文里有更细节的资料,可以分享给大家,就不展开论文的细节。我讲讲论文里边给出的结果,我们到底做了一些什么东西。这张图是一个实验实测的结果,我们把我们的系统、算法实现出来,租用了一千多台计算机,这个计算机分布在世界各地,现在有云服务,我比较方便做这个事情,租一些机器,构造一些结点,然后把这个算法部署上去。测试这个算法需要给它一个很大的工作集,这个工作集里面都是一些交易,让它去做快速的处理,从而去测试它到底能够达到多高的吞吐量。

我们这个工作本质上是为了改善区块链性能,所以我们讲到性能这个事情,它有两个非常重要的指标。一是吞吐量,所谓的TPS,但里面还有一个非常重要的事情,叫做状态容量。这个状态容量的意思是什么?因为区块链上面要存每个人的信息,这些信息需要放在内存里面,让区块链验证交易的时候随时能够访问到,不能放在硬盘里,放在硬盘里是历史交易记录,在内存里面放的是每个人的用户状态,或者叫账簿。前面试图把整个世界放在一台电脑里,就意味着不仅仅是吞吐量被限制住了,状态容量也被限制住,因为一台电脑16G内存是正常,如果你要是一台电脑有一个T的内存,整个互联网没剩几台,这是一个状态容量的性能指标。吞吐量在业务层面意味着流量,意味着用户的活跃度,跟以往很多区块链项目宣称的不一样,在我们的系统里面,这个吞吐量或者TPS从来不是一个定值,所谓的伸缩性的意思不是说给大家报告一个,我到达了一万TPS,而是向大家展示一个能力。你只要给定足够多的计算资源,你把这些计算机放进来,那么我们整个网络的吞吐量就可以线性提升。当然我们做试验只做到了这个规模,做到了一千多台计算机上面部署四万多个结点,我们实验做到这个规模。但是从这个线上看,这个线的横轴是说这个网络被切分成多少个片,最高切分到2048个点,但是在不断切分过程中,它的吞吐量一直在线性上升。这是所谓的伸缩性。很多项目就说我1000TPS,然后就结束了,这个并不是伸缩性。它可能做了一些改善,提高的一下,这个没问题,但是伸缩性的定义是说,我给它更多的电脑,它能够跑的更快。这是伸缩性。

另外一点是状态容量,这是非常关键的指标。它意味着这个区块链系统可以记录多少用户的状态。意味着这个系统用户量的天花板,我们现在看每一个真正有实际意义互联网业务,哪一个不是千万量级的用户量,但这个指标在以前的区块链项目当中很少被提到,因为以前所有的技术改造,新的算法提出来,大家都把目光关注在共识算法上,我用这个共识,那个共识,但事实上这个系统真正的性能如何,共识法更多的是保证安全,如果我们要做性能,实际它是个分布式并行计算协议层的技术,包括里面的数据组织和结构上的数据。以前状态容量这个指标,几乎从来都没有得到过提升,一直就是一个单机容量。但是在我们现在这个系统里面,状态容量也可以随着更多的计算机参与而得到线性提升,这个线性提升不打任何折扣,比如我们分了四个组,就是16G×4。整个线性提升是有天花板,现在论文当中动用了这么多个电脑,至少我们现在还没有触碰到天花板。比如我们现在2048个分片,全网达到一万多的TPS,整个状态容量是几个T,这个天花板是存在的。当我们把它分片分到几十万的量级,应该会到达一个天花板,到达这个天花板的时候,它的吞吐量和状态容量,其实是没有办法容纳更多的机器参与进去,这是分片数,并不是说计算机,计算机可以多,一个分片内部可以有好多计算机参与。到了那个时候是一个千万TPS的量级,是几个PB数量级,这是一个理论上限。但是从现有既使是互联网规模的业务量来看,这个体量足以满足比如支付宝整个业务量。

这是这个论文的一些信息。对于我们来讲,我本身以前也是做技术的,我们评价一个技术,尤其是在区块链这个领域,比如信息特别不对称的领域当中,我们评价一个技术,最好的是你把这个技术写成一个论文,拿出这个行业里面最懂的的专家让他们去评审,他们会告诉你,如果他们接受这个论文是最好的答案,他们认可这个技术,有创新性,并且这个技术是正确的。但是据我所知,区块链的论文在计算机网络会议当中还是挺少见的,今年整个会议当中只有我们一篇是区块链的论文。外界一开始看数字货币,或者加密货币,大家一看是个加密的,最早密码学的人,安全的人冲进去,关注区块链比较多一些。区块链需要安全,需要密码学的一些东西,但是如果大家去看比特币里面的技术,那个技术里面密码学用的就是现行的技术。它真正的技术突破实际是一个计算机网络协议的全新设计,里面的共识算法都是计算机系统里面的一些,并不是密码学的事情。正因为这些,真正学术领域当中,像计算机网络,分布式计算,我粗略估计一下,大概有百分之二三十的高校,有些PHD的学生在做区块链方向的事情,这个领域更多的还是做一些云计算的事情,大数据的事情。NSDI在这个领域当中是蛮难投的,因为它收的少,一年收不到50篇的论文。AI动辄都是收几千篇论文。

我们现阶段致力于区块链最硬核的研究,高性能、高容量的区块链技术支撑,是实现落地业务应用于各种业务场景的关键所在。比如现在区块链大家已经部署一段时间,你真要有一个切实的应用放在上面,根本撑不了。互联网已经是很高的标准,它把每个用户的预期,把业务的预期已经拉到非常高。区块链至少在这几个方面体量和规模上是要跟互联网业务齐平,这样才有意义,这样使得区块链至少在技术层面,性能和容量要支撑得是这样的业务和规模,我们这边最关注它底层的基础设施。

接下来跟大家一起探讨聊一聊。就像互联网当初开始一样,互联网当初开始也是大家开各种脑洞,有了互联网大家可以拨号上网,把全世界的人都连起来,互联网上有这个应用,那个应用,尤其是2000年前后,上面想象了无数的应用,但事实上互联网走到现在,当年想象的一些应用现在才做得了,当年也有很多根本不切实际的东西,大家看上去了,这件事情也就过去了,消失了。还有一部分是在当初的互联网就找到了确实是一些切实落地的业务,但是如果我们从现在去看,这些业务是互联网里面非常小的事情。

我举几个例子,虽然举的是互联网例子,但是告诉我们区块链如果要去应用,找切实落地的应用,不是一件那么快落地的事情,不是一件可以着急的事情。比如互联网早期出来的时候,很多人都已经想互联网可以在上面做生意,买东西,但是为了达成这件事情,有一个非常漫长的过程,我们要把信息流映射到这个互联网上去,这个历经很长的阶段。而且我们要把金流,物流映射到上面去,之后电商才开始爆发。这是有个过程,不是说这个业务想象它有可能有,立刻就能发生。

比如VoIP,当时互联网初期的时候,VoIP是一个非常切实的任务,打电话本来就有这个需求,有了互联网以后电话费下降,这是一个业务,而且这个业务在互联网上出现了,也有很多人做这个事情。从当初的互联网来看,大家觉得这是一个特别脚踏实地的业务,但如果我们放到现在去看,这个业务有吗?有。但这个业务真的是互联网最有价值的业务吗?完全不是。我举这个例子来看区块链,区块链也能够从老世界里面找到一些业务,搬到区块链上面去,有些有价值吗?确实有价值。但是我相信这些事情很有可能并不是未来区块链真正能打造的新的数字世界里面最重要的业务,数字世界里面最重要的业务,很有可能是我们现在根本没有出现的。我更相信在当下这个阶段,更多的关注基础设施。因为不管上面是什么业务,底下的吞吐量,存信息的需求一定会有,这就像当初互联网走的时候,思科干的事情,互联网往前走,肯定会有更多的人连到网上,肯定需要更多的带宽,更多的流量。虽然我不知道发生具体的业务是什么,但是里面有一些通用的部分,一定会发生。这是区块链底层在做的事情。

我们能够有几个方向,根据区块链现有的特性去猜测,或者有一个思路,未来区块链上面可能会支撑什么新的业务。前面讲到区块链本质是规则不可篡改,那就意味着我可以用计算来构建信任,而不是去找背书,站台。用计算构建信任,这个方向上现在其实是有一些业务,比如工业链金融、食品安全,防卫溯源,这个事情从业务层面来讲,它是让这些信任关系可以传递,各个不同产业上下游的公司可以互相协作,这里最大的意义是什么?这些区块链干的不是业务本身的事情,而是给他们业务增加一个很好的湿润剂,比如我要做一个溯源公司,溯源公司要跟很多公司打交道,我跟那些公司去谈,我凭什么要把这个数据给你。如果你是个中心,我干吗要把这个数据给你,给了你以后,万一利用这些数据做其他的事情我怎么控制,把你养大了,未来给我搞事情。区块链不一样,现在很多这个领域的人说我们在上面布一个联盟链,数据和计算过程在每个人家里,我不能随便改。我们上面只做信息流转的事情,比如我做溯源,我上面放的信息就是溯源相关的信息,我上面的计算就是跟溯源相关的计算,我是不能任意部署别的计算,我也不能任意把你的数据拿去干别的事情,有了这么一个技术所保障的信任技术,这就使得大家更容易相信这件事情,大家更容易参与到这件事情。那么业务就比较容易开展,这个方向上已经有很多,蚂蚁金服,也有一些其他的联盟链的公司,他们在做这件事情。从本质来看,这件事情之所以给他们有帮助,倒不是说区块链本身在承载什么样的计算,而是说他给了大家一个可以去相信的支点,这个支点不是任何人可以去背书,我们相信的是这个技术本身所带来的能力,它的信任保证来自于密码学、共识技术。这是第一个方面。

第二件事情是用计算保证执行,免得后面扯皮,钻空子。现在几乎在所有的规则执行过程中,是有人的因素在里面,一旦有人的因素在里面,不可避免会有潜在的问题。像征信、税务方向上,保证执行这件事情会有很大的价值。比如征信、税务早就定好了,大家都知道,但是由于利益驱使,有些人想逃避这些。比如征信,有这些问题也希望逃避惩罚。如果这些信息都被很好的形式,比如我给你写一个借条,这个借条不在链上,甚至没有形式化,这种事情区块链暂时触达不了。如果区块链的业务更多的深入到社会的每个角落,如果区块链系统也是一样,深入到社会各个角落,那我们写一个借条,就在区块链上面写,放在区块链上,没有人能够篡改它,一直在那里,而且它可以用加密技术。区块链有一些隐私计算技术,可以被验证。但是它的信息内容不公开,包括有好多密码学的领域在做这个事情,比如我们要验证一件事情,我兜里的钱比你多。以前你报一个数字,我报一个数字,问题是这个数字就泄露了。现在密码学当中有这样的技术,你不用报,我也不用把,我们可以做一个计算,最终的计算结果可以给出一个结果你的钱多还是我的钱多。这件事情所有人都可以验证,但是大家不知道你的金额是多少。隐私计算这部分东西跟区块链技术是蛮天生的,这边也需要技术演进,很多隐私技术比较慢,这部分需要技术推演。像专利保护也是,如果计算机可以保证执行,可以使得专利保护这件事情变得特别廉价。以前专利保护你要去专利局,跑到公证的地方给你弄一个公证,如果整个过程可以被完整的执行,首先专利的事情能被保护的覆盖面就大很多,而且成本会下降。这就像我们现在小微贷款,以前贷款不可以做,做一个人的征信需要很大的成本,以前银行业务干不了这个事情,现在我们很多行为已经映射到互联网上,已经数字化,现在我们做一个个人征信只要几分钟就完成了,就是计算机算一下。现在这件事情在区块链里一样会发生,大家看看互联网走到现在,多久才达成这个事情,这个是需要时间,对于区块链来讲也是需要时间。

第三个方面,让业务自证清白。自证清白的好处,对于业务本身来讲,自证清白是规避风险,明晰责任。我已经自证清白,说明这个事我本来干不了,出了问题别找我们。但是也有一些人不想自证清白,想浑水摸鱼。如果整个行业当中,有些企业已经自证清白,将是一个良币驱逐劣币的过程,这是一个正向的循环。在这个事情上,我觉得有很大的想象空间。我举几个具体的例子,比如医疗卫生,包括智慧城市,这一类一部分是公共服务,一部分是跟个人相关。它都需要做一些公有数据跟私有数据相关的计算,做一些服务。比如医疗卫生跟保险有关,要评估你。但是不能说把这些数据直接送给保险公司,这个不行。现在所有的计算都是在黑盒里,我的数据交给你了,我也不知道你是怎么搞的,万一你把我的数据送给保险公司,我没法控制。

比如智慧城市,本身是个非常好的概念,但是智慧城市不可能是政府一家来搞,一定是有好多公司参与。这些公司一定或多或少会触碰到这些敏感数据,这些公司能不能自证清白数据我用了,但是我没有干不该干的事情。如果他能自证清白,大家就能信任这些公司,也更愿意去拥抱智慧城市这样的概念。因为它是有很多好处。但是我们要把参与在里面的企业潜在的风险规避掉。这是自证清白。自证清白说的更大一点,在互联网领域有非常多的业务,至少对我们用户是有着实的好处,但是它对公司现有的赢利模式会提出巨大的挑战。举一个例子,比如搜索引擎,搜索引擎给你10个结果,现在整个搜索引擎的结果一页给你10个网页链接,它是不是真的为你服务的,大家不知道。毕竟公司是有赢利目标,很明显他至少两端都需要权衡,一个权衡是说我提高用户服务质量,给你想要的东西。另外一方是我公司要赢利,我要给你我想要给你的东西。这两个是有权衡。那从现实来讲,一个公司这两边的权衡都是认可的。公司一定要赢利,才能活下去,才能持续为我们提供更好的服务。但是问题是说,这里面的天平平衡点在哪里?我们现在不知道。这样的企业也没有办法向别人证明,我没有干不好的事情。现在区块链也支撑不了,有赖于未来技术发展才能支撑得了这件事情。一旦这件事情成立了,一定会有新兴的公司出来,跟大家说,我现在是一个可以自证清白的业务,你所拿到的结果,就是更好的为你服务的。

新的基础设施的更替,最终会导致整个赢利模式的变化。以前能够赚钱的方式,现在没法赚钱。相信从互联网到区块链的更替也会发生类似的变化。我从投资的角度去看这些事情,我们会看里面一些端倪的发生,虽然有点小,但是它是不是走在这个方向上,是我们判别这个事情是不是靠谱的关键点。

从业务自证清白来讲,并不仅仅是只有区块链这一个技术,还有其他的技术也包含在这个里面。当年苹果就提过这个概念,端到端加密,这是用来个人通讯。比如我发一个信息,端到端加密。比如谷歌做一个邮件系统。这些系统都是端到端加密,就可以自证清白,你的数据我牙根没有看,我也不会拿你的数据干别的事情。但是这件事情几乎大部分互联网公司,或者说以互联网广告为赢利模式的公司,他们不可能做这件事情,因为这个技术一点不难,但是会有一些计算代价,但是他们绝对不会做这件事情。因为一旦做了这件事情,他的赢利模式就崩塌了,没有办法在上面做有效的互联网广告,因为它拿不到这些信息。我想说什么呢?让计算机自证清白,未来可能会有更多的技术出来,区块链是里面一部分,还有一些端到端加密也是。我相信后面还会有更多。

说句实话,区块链这个行业信息不对称的很严重,有些人吹区块链是万能的,明显不是。没有一个技术是万能的。当然一开始大家对区块链有些误解,觉得区块链是一个不可篡改的数据库,这件事情是不对的。区块链的本质,它让这个计算规则不被改变。区块链上面计算所涉及的数据,建立的状态,可以是任何的数据结构,这件事情在以钛坊里面已经体现出来。第二个事情是说,它真正不可篡改的不是这些数据。如果规则里面包含篡改,修改这些数据的规则,这个数据就可以被修改,没有问题。真正不能修改的是规则,这个规则本身不能修改,才导致了这个技术本身最独特的地方,这也是未来它去做新业务的支点。当然它不是万能的。

有两个很关键的地方,第一区块链上面所要的这个规则,这个规则要能够被非常完备的数字化和形式化。昨天有教授问我到底能不能用区块链来解决,也许未来可以,至少现在不可以。道德这件事情怎么形式化?毕竟我们是用计算机技术来支撑这个世界。前提是这个东西能被计算,要是不能被计算,计算机帮不了什么。但是这条线上,有很多的努力,包括互联网领域当时也是这样,有很多的领域,把一些以前不可计算的东西,没法形式化的东西,没法很好数字化的东西数字化了,把它搬过来。有些甚至是物理层面的,比如说GPS,以前你在哪里,这件事情没有办法数字化,没有办法量化。比如你说一个地名,这个地名也是很难计算的,因为它需要有一层层的影射,数字地图的影射才能知道你到底在哪里,然后有GPS,有了整个全球的数字地图加上GPS,才把位置这件事情映射到了互联网上,把它形式化,数字化。比如社交网络做了那么多,整个社交图谱存在以后,我们才把社交关系影射到了互联网上。我有了社交关系就能在上面做一些计算,能估量你这个人是个什么样的关系。说白了,你是不是个名人,以前没法计算。现在你的社交关系被影射到网络上,我可以通过一些信号来算你是不是名人,是不是一个大V。比如小微银行贷款也是一样的,我怎么知道你是一个有信用的人,信用怎么被计算,也是依赖于相关的数据信息被影射上来。区块链也是一样,区块链要达成这件事情,也是说区块链涉及到的规则要能够充分被形式化、数字化。区块链所涉及到的这些信息,这些信息影射上来以后才成为据,它得上到链上,或者以某种可靠的形式形式化,到网络当中来,那么它才有可能去触达一些新的业务。虽然区块链做的事情跟互联网做的事情是蛮不一样,但是对整个行业发展的推演过程有很多可预见的。

这也是第一次宣布一件事情,我们对区块链不仅仅是停留在学术研究的层面,我们会把论文的成果转化成产品级的实现,会有在线的区块链系统。我们计划在8月份会有测试网的上线,这是第一个里程碑。当然后面还会有。

媒体问答

记者:为什么选择这个顶会?

王嘉平:之前区块链相关工作很多发表在密码学会议或者网络安全会议,我们为什么投NSDI呢? 因为我们的工作核心突破在于大幅提升区块链系统的伸缩性,而不是提出了另一个的共识算法。NSDI全称是Networked Systems Design and Implementation,是 USENIX (Advanced Computing Systems Association)旗下的旗舰会议之一,也是计算机网络系统领域久负盛名的顶级会议。NSDI 侧重于网络系统的设计与实现,注重系统的性能和伸缩性。众所周知的著名大数据系统 Spark 就发表在 2012 年的 NSDI 大会上。最懂网络系统伸缩性的学者,在这个领域。

在今年接受的49篇文章中,有超一半来自美国顶尖高校(MIT, UC Berkeley, Stanford, CMU, Princeton, Cornell, UW, Harvard, Yale等等等),另外近一半来自微软,Google,Intel等美国知名云计算相关企业。其中国内高校仅有清华大学有3篇文章被录用,分别是关于网络系统建模、超算系统监控以及RFID无线技术。另外值得一提的是,今日头条(Bytedance)有5篇文章被接收,全部是和微软合作发表。果然是不少人从微软跳去了头条 (微笑 。 在今年录取的论文中, 仅有我们这一篇论文是和区块链相关,很荣幸被安排在会议的第一天,分布式系统专场,进行演讲,同一个场次的还有两篇分别来自Stanford和MIT的论文。区块链相关技术在整个学术界还是非常新兴的研究课题,希望能有更多同学来这个领域。 

记者:我看到有些区块链业务已经在采取多链模式,我们研发的多链模式,跟他们有什么本质上的不同?

王嘉平:多链是这样的,现在不管是公链还是什么链,现在多链典型的有Cosmos,如果大家去细看它的多链是怎么做得呢?它把一条链上承载一个业务,这个逻辑跟当年互联网一个服务器承载一个网站,这个挺符合区块链的现状。我每个业务都单独发一条链,一个业务一条链。比如比特币或者以太坊,是所有的业务放在一条链上,他们往前走是一个业务单独一条链。这是一个提高。链和链之间不打交道,母链上是有资产,他们自己内部业务完成是自己独立。从技术角度来讲,如果你互相没关系,这个事情当然好做。而且伸缩性可以做的非常好,可以弄一千条链、一万条链、一亿条链都可以,就像最开始互联网上我是用一条链去支撑一个网站,这是很容易的做到的事情。但是我们行业往后面走,这个事情会发生变化。因为这个行业不可能一直都是一堆企业,如果这个行业抓住真正的应用,这个行业最终像互联网一样,会有特别巨大的头部企业。到时候一定会出现这个情况,有一个单一的业务体量非常大,我们现在一个互联网业务背后是无数台计算机一起撑这个流量。我们做的这个技术更着眼于下一步,当业务变大到什么程度,一条链放不下。我们做了多个分片,每个分片内部是一条链,那个时候一个大的业务,工作量会被分开来放到不同的业务上面去。我们能够让好多链聚合起来,支撑一个单一的业务。这件事情比较难,伸缩性也是有天花板。在这种情况下,它可以单独去做。问题你是同一个业务,业务与业务之间会打交道。这种时候就意味着我们每一条链之间是有关系,而且这个关系甚至会变得非常频繁。这就使得这个技术设计非常有挑战。这个思路前面有人做过,不是没有人做。片与片切分开不同的链之间互相打交道,以前的问题是什么?这个打交道所带来的代价会随着切的越细,这个代价会越大,这个代价超过你把事情切细带来的好处。

这里面有两个技术点,我们提了一个最终原子性,在区块链上面的业务,比如转账,需要的是一个原子操作,一旦你把系统切开以后,这个人可能在这里,那个人可能在那里,像单链很简单,两个人都在这个链上,现在他们两个人在不同的链上,最终原子性的技术可以保证这边扣了,那边加上去。我们可以使这件事情非常高效的完成,当然也是有代价,但是它的代价是一个定量的事情,跟你的分配个数无关。我们分的再多,就是一个固定的代价,这个代价是把性能除二。我们对状态容量就是两千倍的提升,对于吞吐量却只有一千倍的提升,跨分片的计算是有代价,好处是代价除以二,我只要分片多,这个性能就可以线性上去。

记者:相当于我们自己测试已经可以实现这种链之间的协同?

王嘉平:这个是论文里面非常重要的一点,否则你就不正确了。至少要有一个完整的体系。这个东西对我们来讲是代价要低,整个伸缩性才有意义。以前也有很多区块链项目,也有做分片的概念。分片这个概念,以前大家是说要尽量避免跨片的事情发生。以前还涉及这个用户要动态的分配,一会儿在这里,一会儿分配在那里,这不合理,一旦用户要动态分配,这涉及到状态要动态转移。反而复杂。在我们的系统里面,你这个人在这里分片里,就永远在那里,我们做互联网里面就是这样,根本不动。但是我们做到一件事情,我们的跨片交易要处理的时候非常高效,所以我们无所谓跨片的比例有多高。刚刚那张图上展示的是分片分到2048的情况下,当分片分到64的时候,跨片的概率基本上已经是百分之百,所有的事情基本上都是在跨片下发生的。用户切的越碎,跨片概率越高。我们从学术角度来讲,我们比较严苛的去做这件事情,我们要做测试,得有一些数据。有些人就自己随机造数据,你测不出来一些东西。我们的数据是拿以钛坊历史交易数据来做测试,就会发现一些很有意思的东西,有些对你的技术也是一些挑战。比如里面有2%的交易是打给一个地址,全网总共有八千多个交易,有2%是打给一个地址,如果你随机生成根本不可能构成出来。我们认为只有用真实数据去测性能,这个性能结果才有说服力。

记者:一千倍的吞吐量提升,是区块链的计算能力提升一千倍?

王嘉平:其实不是。吞吐量的瓶颈是什么呢?当然它涉及到计算。吞吐量最大的瓶颈是说,每个计算完了要出块,最大的瓶颈是通讯。这件事情跟共识算法没什么关系,不管你是POS,BSK,TOW也好,不管共识有多高效,假设共识的代价为0,你为了达到这个TPS,你总要把你出的块送出去,并且所有的结点要有足够的带宽去接收这些区块,要收得回来,因为网络不断的生成新的块。你可以测算一下,最大的瓶颈是带宽。我这边有一个推演,如果你是个单列系统,在现在的互联网平均带宽下面,最高的TPS不可能超过六千左右,否则所有的带宽什么都不干,就用来接收你的信块,这是你吞吐量的上限,不可能比这个更高。包括著名的algorand这样的系统,就是单列系统,它的性能不具备伸缩性。伸缩性这件事情跟共识算法没什么关系。

现在也有一些跨链,Cosmos讲你们每个业务分开做,偶尔你们要打交道就跨一个链。原来跨链是很难做的,以前的跨链跨的是不同的链,跨以钛坊,这两个链互相不配合,他们互相也不承认对方的证明,这个时候你不得不引入一个中心方,用签名来构造这个证明,两边互相传递。在我们的系统里面,我们跨分片这个东西跟跨链不一样。我们所有链的都是我们自己,我们会互相承认对方。以往大家做分片系统会有一个主链,我的系统里面没有主链,我的分片系统里面比如放了十个片,就是十条链,这十条链互相之间知道什么样的数据可以传递给对方,互相知道对方共识做到什么样的程度,我这边可以去验证传递过来的一些接力交易。因为你有个主链,本身会成问题,它会成为我的背景。我们后来发现你完全可以抛弃这个主链,把整个设计降低到最低。

记者:第二个问题,有些报道说单片和多链是区块链发展的两个方向,您是怎么看待?未来一定会是一种模式取代另一种模式吗?

王嘉平:不完全是。单链有点象CPU,虽然慢,但是足够灵活,几乎什么东西都能做。多链,不是指Cosmos那个多链,我说的多链是分片系统的多链,它有点象GPU,每条链就是原来这些性能,它靠把这些链堆起来并行工作,得到一个非常高的吞吐量。为了这个事情可以高效的做,不是没有代价的,它牺牲了一些灵活性,开发会比原来难一点,这非常像是GPU,GPU也是一样,你在GPU上面写程序就是要比CPU难。现在有大量的当年CPU算法通过大家的努力搬到GPU上面去,但是它确实写代码,程序逻辑不像CPU那么灵活,这是高性能付出的代价。比如分布式计算系统,它上面的业务逻辑代码也不是随便写的,不像CPU里面写代码那么随意,一会儿访问这,一份会儿访问那,都是随便干的。你在这种背景系统里面,是做不了这件事情。正因为它们有这样的特性,我相信单链和多链会同时存在,但是同时存在并不是说它们要互相竞争,实际上它们是捕获了这个市场不同的目标,如果有些业务真的是需要非常灵活的业务逻辑,有些特定的要求,比如支付是非常容易搬到多链系统里面,因为每次只涉及你,不涉及别人,这个业务非常容易搬到多链系统里面。万一有些业务每一次计算都要涉及到非常多的人,而且结构不可预测,非常碎,一会儿涉及你,一会儿涉及我,这种类型的业务逻辑放到多链系统上面就会非常好。我们每个交易要判断它能不能有效,比如我们做支付,只要判断一个有效,付给钱的人不用管他的状态,但是如果有的业务,这个业务是不是成立,这个交易是不是有效,我得判断一堆人,这个系统对于分片系统来讲非常难。说白了,实际是一个数据访问局部性的事情。如果你的数据访问有很好的局部性,就能很好的被定性。那么多GPU也好,GPU上面有一个Cuda语言,之所以语言这么设计,就是方便用户打造程序执行过程中的数据访问的局部性,这样的代码就非常好的能够部署在硬件,或者分布式系统上面。两边有一些独特性。

你刚才说L1、L2,我可以讲讲。现在有一类L2,它冲上来号称做跟L1一样的技术,比如它也号称我要做高性能,我用L2来做高性能,这件事情没道理。我们之所以把技术站分成两个L,就意味着它们一定有不同的任务要去解决。如果是同一个任务,它没有理由分开。我具体讲讲L2有什么东西是L1比较难解决的。因为对于L1来讲,我们做高性能、吞吐量非常大,容量非常大,你看所有的计算机系统,吞吐量和延迟是有矛盾的。我的吞吐量大,通常就是每一块都很大,我可能要攒攒足够的任务一把完成,就意味着你要攒的过程中,就有引入延迟。包括L系统,包括网络传输系统都是这样。如果你要吞吐量大,你的延迟就大。这件事情很有可能是L1解决不了,而依赖于L2来解决这个延迟问题。这是一个技术站上的特异性,为什么L2有可能解决,而且有可能解决L1不能解决问题的。那是L1一旦架好,所有的都跑在它的上面,它就是一个单一技术,所以它上面的技术必须通用。但是L2不一样,我一个L1上面可以部署好多L2,就意味着L1可以针对特定的业务场景去做优化。比如闪电网络这个逻辑不通,但是假设这个东西成立,因为闪电网络假设上面有些人,两个人之间会有频繁的交易发生,我们自己开一个通道交易,交易完了再送到主链上去,这是一个很好的想法。但这是一个垂直场景发生的事情,如果他成立的话,L2可以做,做完了以后不仅可以提高吞吐量,也可以降低延迟。

但是对于闪电网络来讲,有个问题是这个前提是不是成立?前提是否成立可以验证。我们是不是世界上有那么多的交易结构,我们两个的交易结构相似吗?把以钛坊历史交易拿来跑一遍,看看里面有没有这样的交易结构,但是没有人做这件事情,都没有分析过他们提出的这个假设是否成立。我举一个正向的L2的例子,比如0叉是一个典型的L2,但是解决的是垂直业务问题,下单的凑合,这是非常有道理的L2。这是非常优秀的L2,它就是解决L1没解决的问题。为什么L1没解决呢?因为这是一个垂直场景的问题,不应该放到L1里面去。L2去解决,而且把它解决的很好,节省了很多吞吐量,延迟也很低。这就是一个非常非常优秀的L2的例子。

记者:第一个问题,我们这次论文发表的重点是偏技术的布局,我们在区块链领域的投资会比较少,融资比较谨慎的原因,主要是什么原因?

王嘉平:首先投资的逻辑,是你有没有理想的案子可以投。这件事情并不是因为我们有一个预先的偏见。整个市场上面,即使看区块链的领域,到底有些什么东西可以投。我们不仅仅是从投资角度去通过这个行业,我们自己是有这种能力的,我们会看行业里面有没有关键问题长久没有解决,我们冲进去看看,能不能在里面做一些贡献,这就是为什么发文章的原因。区块链现在信息不对称很严重,我们花了时间去发这个论文,进行同行评议,这个事情蛮周折的。我们希望让更多的人去听到一些中肯的声音,这个技术的本质到底是什么,能给行业真正带来的效果是什么,而不是把它吹的天花乱坠。

记者:可以详细讲一下你说的这个过程很曲折,以及信息不对称的严重现象?

王嘉平:信息不对称,因为这个技术本身跟我们之前的计算系统有很大的不同,它追逐的目标也跟以前不同。技术的圈子里面,真正理解区块链是怎么回事的人都不是那么多。这是一块。另外一块,现在区块链还被包了一个数字货币的外衣,这是不正确的,区块链不等于数字货币,区块链是一种全新的计算范式。我们这次之所以强调的是区块链技术,是因为我也希望大家知道区块链这个技术到底是什么,不要只看到数字货币,这个世界很大。这就像互联网刚开始的时候,那时候也有东西可以炒,可以炒域名,很多人炒域名,很多人对互联网的理解就是炒域名,也有这个过程。我的意思就是说,如果大家认知一直是这样,对行业发展没有办法。这需要一个发展的过程,在大体量业务出现之前,谁的声音会比较大。类似的事情正在区块链领域当中发生,会有一个过程。

记者:可以说这是一个正本清源的过程。

王嘉平:从互联网开始,新的技术发展也是一个很开放的事情,并不是说只有权威。大家看到很多被重度使用的协议,其中不少是一些工程师发明的,正是因为工程师的思维把这个事情做的足够简单。当时有些技术做的非常牛逼,非常复杂,但是真正在互联网上留下来的,被大家广为采用的其实是那些特别简单的,我当时写这个东西的时候尽量把这个技术变得简单,不要在里面引入一些老技术没有的东西,来达成我们技术的特性。

记者:其他的领域,国内外在区块链领域比较多,比如食品溯源,金融科技等等,你怎么这些领域的应用状况,也是特别泡沫化,还是大家浮在表层的状态?

王嘉平:大家都在探索。这是大家探索的过程,看这个东西到底能用在哪些,能为哪些行业当中找到一些实实在在的东西。

记者:你会提一个什么建议吗?不管是对创作者,还是投资者来讲,需要谨慎的点在哪里?

王嘉平:少看概念,而看这个技术用到这个业务当中是不是能够提高效率,降低成本。任何的技术服务于其他行业,提高生产力一定是本质,任何的技术能驱动的也只是提高生产力。提高生产力到一定的程度以后,可能会影响到生产关系,组织的方面,这是有可能的。但是它一定要有一个提高生产力的内核。

记者:最先落地的提高效率点的是哪些?

王嘉平:金融领域容易最先落地。最早的商用计算机就是在银行里面用,在金融体系里面,它的数字化、形式化程度最高,这些行业里面规则非常非常重,规则相对来讲比较简单。比起互联网,我们做推荐系统,做搜索引擎,要简单很多。因为这两个提醒,使得这个东西搬到区块链上特别亲和。现在如果规则非常复杂,数据访问非常厉害,区块链也撑不住。如果信息没有办法很好的形式化,也搬不到区块链上。包括AI早期的发展,很多也是在数据可以充分形式化的领域中发展。计算机说到底也只能算,只能跟数字打交道。

记者:如果做一个中外对比,区块链领域的比较是落后于国外,但是它又在几年的时间内经历一个泡沫化,低潮,再政策回暖的过程,据你的观察,这样的国内波动主要原因是什么?

王嘉平:我先讨论一下是不是有你表述的这个现象。首先区块链这个领域没有一个明显的中国比美国落后的现象。你看整个行业当中,现在区块链领域当中,最核心的几个基础设施,都是在中国完成。如果我们说到技术,在我这篇论文之前,确实中国人在技术领域,官方的突破比较少,后来我才发现我这边技术是中国人在这个领域发的第一篇。从技术上来,我们并不落后。区块链这件事情是一个全球的事情。最早最早的技术发源于西方。我希望大家避开这个误解。

记者:我看到有人评价多链区块链,可能对用户不太友好,因为会有多个入口,生态不好你,你这个多链会有这个问题吗?

王嘉平:我的不会。多个入口的本质并不是多链,因为它是多个割裂的业务。从逻辑层面来讲,我更像以钛坊,只不过是一个性能特别高的以钛坊,所以我面向用户是一个统一的入口,它在上面可以找到很多业务。大家都有这个思路,整个网络工作量那么大,要把它切一下。你刚才说的是我按照业务切,一个业务切一块,这个带来的问题就是你的颗粒度不能很细,如果一个业务特别大,你就切不下去,因为你的性能提升是有限。我是通过里面的流量来切,不管这个流量服务的是谁,我就按照流量来切。我切分的层级更低,好处就是我能把业务切的特别细,支撑得了一个业务。

记者:我们可以支撑多个业务?

王嘉平:是的,就像以钛坊一样上面可以发好多。

记者:我有一个关于区块链和人工智能结合的问题,去年有一段时间大家都在讨论区块链和人工智能结合会干很多事,就现在这个状态,有一种观点认为这两种技术分别都不成熟,没有谈到结合的事,也有人说这两个技术在一些特定合适的场景下,它们两个可以结合去做更大的事情。

王嘉平:跟AI相比,区块链确实还不太成熟。结合有没有效,或者有没有意义?结合一定是有意义。问题是具体怎么结合。我们谈一件事情有没有意义,是谈一个具体的案子。从大方向来讲,这两个不同维度的技术,一定会有结合。之前我也看过一些项目,有些结合点是说AI需要算力,区块链在那里算,区块链还是一个分布式网络系统,还有一些说利用用户的闲散资源给AI提供一些东西,这个方向是没意义的。区块链讲究的是规则不可改变,讲的是个公平。在区块链这个世界里面,你要去跟人性能,但是性能永远不是它的特性,它的特性是不可篡改,信任。如果你要拼性能,绝对拼不过云计算系统。它明显比云计算系统里面的冗余来的多。有些人说我用用户的闲散资源,这个也是要钱的。大家都需要对计算付成本,云计算系统批量的采购,批量的运维管理,规模效益一定存在,云计算最终出来的算力一定是成本低。另外它把AI这部分计算逻辑,放到智能合约里面去。现在是有点挑战的,但是这个从大方向来讲是个有意义的事情,使得这个智能合约在执行的时候,不仅仅是执行一些简单的逻辑,还可以去执行更为复杂的像AI这样的东西,本质上是提升区块链的能力,这个是有价值的。我看到有这两个方向。有些讲的AI需要数据,需要区块链去做数据流转的事情,这件事情是有可能的,但是还蛮不成熟。这里面涉及到隐私计算,这个事情要能够很好的解,依赖于那部分的计算有更好的算法出来,变得更高效,否则现在太慢。

记者:你刚才说是一个分片的以钛坊,现在以太坊在做2.0,也用到分片。

王嘉平:当年比特币提这个技术的时候,发了一篇论文,并没有同行评议的过程。他开了一个不好的头,现在场子里面很多人冲出来我有一个什么厉害的技术,可以如何如何,然后就自己夸自己。这个场子里面真正有能力去评价技术的人不多,这就是为什么我去把它放到顶会上去做同行评议,让真正懂得的人来评。比如今年这篇文章,我知道有三个区块链项目投了今年这个会议,这三个项目都是非常著名的区块链技术,但是只有我们中了。如果我们看一次投稿,也是存在一些偶然性在里面,我不是说他们不好,但是至少你要有这个过程。但是与我来讲,这不是一个我自己能说的事情。比如他真的觉得自己是个突破性的技术,应该同行评议,让更多懂得人来看一看,这个事情到底是个什么样的事情。分片这个事情吹了好多,为什么我的文章里面没有出现分片两个字?因为这个词之前被用烂了。

记者:现在很多区块链都在做分片,这些分片技术会哪几块,你比较看好的是哪些分片方向?

王嘉平:分片没有太多的方向。区块链有通讯的工作量,计算的工作量,储存的工作量,内存的负载。之前有些方面的工作没有做一个彻底的工作,比如它做了交易分配,它把里面一部分通讯给做分片了,比如状态他没做分片,分片不完善。虽然不完善,还提了一个概念,把自己叫做交易分片,也有人说我做了状态分片。这样的系统导致的问题是什么?状态是分片了,那部分可以伸缩了,如果交易没有分片,就会是瓶颈。我们这边强调你肯定要全部分片掉,你从通讯、计算,交易的处理,交易的执行,到状态的维护,肯定是要全部分片掉,才能有一个整体的性能提升,容量的提升。全分片一定是唯一正确的方向,因为你不是全分片,这个分片根本没有意义。

记者:做成全分片有技术门坎吗?

王嘉平:有技术门坎。一旦全分片的话,就意味着每个分片内部计算的时候,信息不完备,不像以前以钛坊一样可以非常容易的去访问这些数据,这些数据一旦分开以后,这个数据根本不在里面。我们就提了一个接力计算的事情,涉及到你这个分片的计算,先在你这里算,算完了,你出一个证明说,我这里已经算完了,该改的状态已经改了,再到下一个分片,你这边接着算,这需要良好的设计,不仅仅是你要告诉别人我做了这件事情,在区块链系统里面还需要证明我前面已经做了。而且要保证安全,不能伪造,这是设计中很有挑战的地方。还有一个问题,像挖矿系统,是通过算力来保证,一旦分片,每个片里面的算力就会下降,这是论文里面的第二大问题。分两片,一片是解最终原子性的问题,第二个我们起了一个名字诸葛连弩挖矿。我们当时讨论半天,后来起了一个中文的名字。

记者:区块链在版权保护方面,具体如何应用?

王嘉平:这是区块链当下就可以支撑的,它就是一个上链存在的事情。如果业务量很大,可能也会需要多链,只不过这个多链,真的是放在这个链上就在这个链上,跟别的无关,因为它不是人与人之间的关系,它是个单独的关系。但是依赖于后面的业务,更重要的是依赖于司法系统承认的体系。说白了,它本质上能做的事情是提供证据,如果司法系统可以采证区块链上面的证据,这个业务就成立。这个业务一旦成立,就意味着它有非常大的好处。因为区块链系统里面本身就是一个开放的系统,不会像前面发生的事情,一家独占我敲了一个图章就算我们家的,区块链是任何人都可以敲的图章,看谁敲的早。

记者:最近注意到迅雷链也是用多链架构,号称自己能达到几十万TPS,我们最近做了一个访问,币安链的出块速度可以达到1秒,速度比Visa还快。以太坊是20秒,比特币是10分钟。您这个系统主要是解决什么问题?我们会不会陷入到一个不必要的方向去,很多区块链数据并不一定上链,区块链需要承载的技术性能要求并不太高。

王嘉平:第一个问题,我们这边讲的是技术是伸缩性。我们不你说要多少TPS,这不是重点。重点是在我们的架构上你想要有多少TPS,就能有多少TPS,你只要把机器投进去,只要你的社区规模足够大,就可以支撑得住你想要的TPS,这是所谓的伸缩性。而不是说我现在做完了,跟外面报一下我有三千TPS。这是伸缩性。你刚才说的那两个链我没有太仔细研究过,可以看看它的社区是什么样的形态,是不是所有的东西都关在机房里,我之前看过很多项目,有百万TPS都有,他们的结点都在机房上。

第二个问题,我们从整个业务去看,并不是所有的数据,所有的用户都要上链。比如个人通讯,这个业务如果自证清白根本不需要上链,用端到端加密就可以完成。这件事情并不是说所有的东西都要上链,这个逻辑没问题。但是什么样的东西需要上链呢?链本质上搞的是一个共识的事情,任何业务如果需要共识,你需要向第三个人证明一些什么事情,你就需要区块链。典型的支付就是这个事情,你要向第三方证明曾经有那么多人打听你的账户,所以你想要这么多钱,光这件事情已经是个非常大的问题。区块链的性能和容量一定是非常关键的。我再强调一遍,容量这个事情以前没人提,那是因为容量一直没有得到改善。其实容量是个极其关键的事情,说白了如果你号称有百万TPS,但是里面能放到用户只有几万个,怎么可能让这几万个人做得出百万TPS的活动,吞吐量跟你的状态容量是有相关性,仅仅把吞吐量提上去没有太大的意义。这就是为什么在我们的体系里面要同时提高这两边的性能,吞吐量要高,状态容量要大。

记者:对于分布式可信计算来说,区块链行业从去年开始DAG是很受推崇的方向,但本质上已经不是区块链,你对这两个方向怎么看?

王嘉平:现在DAG技术不是很成熟,最初阿尔塔提出来DAG,搞了半天发现这个安全性没有保证,所以用一个中心的结点维护一致性安全。广义来讲,他们也算区块链,虽然它没有链的结构。包括有些项目用DAG这个理念,本质是有一条主链,这个都在区块链的范畴里。DAG有点意思,它在理论层面都不成熟,安全性没有保障,不到工程产品的层面。

记者:现在区块链技术对于提高人工智能的安全性和隐私性有很大的应用,目前对于安全和隐私的解决程度怎么样?

王嘉平:现在可以讲没有什么现成的业务,因为现在数据不在一个开放的环境当中,大家为什么用区块链来解决问题呢?现在数据都在跟业务相关的人手上,他自己用就好了。如果有一天这个数据掌握在每个用户手上,不掌握在这些平台方,那个时候区块链才有在里面起作用,使得这个数据流转。比如一个用户把我的数据给某一方去用,依赖于区块链去跟踪这个数据怎么被用的,有没有不好的使用,但现在阶段数据的来源都不是这么一个结构,现在还不是时候。

记者:关于商业模式的问题,现在整个系统对于计算性能上有很大的提升,给金融业务放在区块链上提升了更多的可能性,现在计算都是其他地方的个人或者矿区来完成,一些用于营销的数据因为一些加密的情况没有办法用到,这些金融公司怎么赚钱?

王嘉平:当年互联网出现的时候,微软也在想微软怎么赚钱,怎么继续卖软件。技术核心是有可能会带来一些办法,这个变化不仅仅是用户体验的变化,最终会带来商业模式的变化。你看传统的金融公司,以前的赢利模式还能不能赢利呢?大概率需要发生一些改变。

记者:比如支付宝,现在用你这个东西能不能提高效率,降低成本,现在是什么情况?

王嘉平:区块链做的事情,它要提高效率,但是它本身给大家带来的不是说一个IT层面更廉价的支付系统,它带来的是这个支付系统本身更高的信任,因为天生来讲,区块链的成本会比云计算的成本大很多,如果拿区块链的算力算一些云计算干的事情,不太切实际。正因为区块链要做到公开透明,任何人都可以参与,它里面的计算是比云计算冗余好多倍,从性价比的角度来看,区块链优势不大。区块链给你的意义是它构建出来的信任。我们为了这些信任,为了构建出来的这些规则,带来这些硬件成本的提升是完全可以的。

相关文章

联准会维持低利率、强调经济正复苏,未来数月通膨将持续高于目标

美联储周三会议后表示,将维持宽松政策,因为通胀仍是暂时的,不过同时也暗示美国经济正在复苏,不再需要那么多货币支持。美国联邦公开市场委员会(FOMC)表示,将基准利率保持在0%至0.25%的范围,并表示将维持去年12月承诺,每月购买至少1,...

新的一年,这 10 个区块链项目值得你在 2 月关注

新的一年适合宅在家里充电,我们为你划出了将在 2 月有重大进展的 10 个区块链项目,值得你关注起来。 原文标题:《头等仓研报:盘点二月份有重大进展的项目》 撰文:头等仓 沉思 无论牛熊,币圈不缺话题热点,本月热点非 BSV...

YAM 只是金钱游戏吗?发起人亲述其运作机制与价值

YAM 表面上是金钱游戏,但有潜力成为资金累积和分配的金融协议。 撰文:Trent Elmore,Topo Finance 联合创始人,DeFi 项目 YAM 发起人之一 编译:Leo Young 过去几天我一直处在 YAM...

9家险企纷纷”+区块链” 保险创新最后一公里望破局

区块链正在掀起一股热潮,众多金融机构纷纷入局。事实上,保险公司早在2016年就已经开始区块链方面的探索布局。 2016年3月份,阳光保险推出了基于“区块链”作为底层技术架构的“阳光贝”积分,用户在享受普通积分功能的基础上,还可以“发红...

区块链将在食品行业建立信任的3种创新方式

信任是一件脆弱的事情。打破它一次,人们永远不会忘记。在食品行业,信任正在减少。 仅仅看Chipotle就能知道。在2015年末,该公司经历了大肠杆菌爆发事件之后,利润与去年同期相比下降了44%。该公司已经发放了数百万张优惠券,通过免费...

影响网络安全的九件事

从去年9月发生的Equifax事件到最近通过Under Armour窃取MyFitnessPal数据,这几个月备受关注的网络攻击数量不断攀升。每家公司(无论规模大小)都必须为他们成为下一个受害者的可能性做好准备。 为了保护敏感的客户数...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。