中国实体商业区块链+人工智能+云计算,让不可能成为可能

2018年7月5日 23:00
來源:奇点财经

人物背景介绍:蔡栋, 麦当劳(中国)首席数据智能官,负责战略、IT和大数据;InfiniVision深见网络科技, 负责iABC Labs下DeepInsight洞见AI实验室、DeepSource深源区块链实验室、DeepFabric深网云计算实验室和DeepEdge物联网实验室;Altius One 基金会AIX人工智能+区块链项目联合创始人;Linux基金会超级账本Hyperledger项目董事会成员,工信部区块链发展论坛副理事长;中国电子学会区块链专家委员会专家;国际数字经济联盟理事专家委员;前万达网络科技集团总裁助理兼首席数据官/首席架构师;之前在伦敦投资银行、全球能源行业负责交易系统和大数据卓越中心;是西欧超过一万会员的人工智能、数据科学家社区DSL联合创始人兼CTO;全英2015/16年度前50名数据领袖和最有影响者

蔡栋 Charles Cai

在伦敦Data Science London DSL,蔡栋是DSL联合创始人兼CTO

2018年6月27日,香港奇点财经来到上海,与蔡栋,这位中国实体商业区块链+人工智能+云计算第一人做了一次深入的访谈。如果说目前许多区块链项目还在对行业去中心化进行探索和Proof of Concept,那么他们所做的应该是Nasa级别的。如果说目前大家还在为扩容,吞吐量,谁真的可以做到百万tps争得面红耳赤时,他们拥有的庞大的数据库早已在自己开发的底层技术上实现分片,跨链,failover clustering。 “AI + Big Data + Blockchain,you are making impossible possible.” 带着如此巨大的一个使命,我很好奇他是如何耐着寂寞,守在传统行业第一线,深耕细作?

Part 1:“我对大数据+人工智能+云计算的理解也是逐步过渡到位的。”

早年我在新西兰昆仑国际做外汇交易,从十几人的团队做到了跨国公司,2008年我去到英国给Barclays做能源交易,OTC为主,是数字化的平台(Digital);2010年转去给英国石油做能源交易才发现,那里的交易是实体的石油 (Physical),能源是被真实的通过BP全球1500+艘的油轮运来运去,我们意识到这是一个大数据的工作,从决策,预测到供应链。后来来到万达,我们也是尝试物理实体商业的场景, 解决的是就业,人们日常息息相关的衣食住行的生活问题。之后鉴于万达的一些现金流的问题,我们被授权商业化运作,加盟麦当劳,不仅可以继续尝试对数字化改造,大数据的努力, 同时我们的ABC实验室里进行的人工智能+区块链+云计算也得到了认可,接受了中信资本的投资,加上我作为联合创始人,与团队共同持股,形成了今天的InfiniVision深见网络有限公司。未来我们会增加一个实验室,针对IoT物联网,目前刚开始运作。也就是说,我们的四个实验室就应该简称为iABC。

InfiniVision成立时,团队与麦当劳及中信资本的股东们

原先区块链的使用与云团队、人工智能并没有特别多的融合。当我们把这些团队放在一起,让他们认真相互间去磨合, 就带来了许多发展。 大家可以这样理解我的几个团队,首先我们能够把实体商业,也就是物理世界里的大数据搜集后整合到一起,这个工作就已经很不容易,然后是对数据进行分析,也叫机器学习。 而人工智能是deep learning, 模拟神经网,可以处理语言、语义、计算机视觉等非结构化的数据。因为deep learning是一个并行处理的过程,通过这些大型神经网络的计算,也可以用在结构化的数据,例如类似谷歌的广告算法上,所以人工智能应该算是机器学习的一个分支。 然后我们需要云的处理,要分布式计算,而各类云计算模型以及企业混合类型如iPaaS 已经在推广,我们努力的方向是云原生(Cloud-Native)的模块开源工作。(编者注:云原生,是Matt Stine提出的一个概念,Cloud Native是更好的工具、自我修复系统、和自动化系统的集合,可以让应用和基础设施的部署和故障修复更加快速和敏捷,极大的降低企业在云计算方面的部署成本。)区块链则是把任何有价值的数据连接起来,价值互联网,Internet of Value, Internet of Money。一是金融类数据,泛数字权益; 二是溯源范畴; 三是供应链的改善,提升用户的体验。但是真正想要颠覆传统行业的商业模式,解决痛点根本没有那么容易,我们还要在私有链,联盟链,公链以及跨链方面做巨大的尝试,还有争取社区对你的支持。

我与区块链技术的认知要一直追回到2008年的经济危机。“危机”,每次其实都是有“机会”的。我从Barclays交易平台上学到了许多,Barclays是金融危机时赚钱的三家投行之一。后来中本聪的论文出来后,我们立刻就关注到,我还通过丝绸之路买了200美元的比特币。2013年以太坊为众筹来到伦敦,我们就有接触, 认识了Stephan Tual, Dr. Gavin Wood, 只是从2013-2014年以太坊实在不好用。 而2014-2015年间年我作为intel innovator的社区贡献特别成员,参加了intel 举行的黑客马拉松,用比特币里的ColorCoins,作了个Chihuahua Club Membership币,加上那时是万圣节,非常受小朋友们的喜欢。 现在看来,今天token economy已经成为了一个多么庞大的产业。

我的总结是,对于创新技术,如果不想被颠覆,学点颠覆性的技术是很有必要的。

Part 2:“如果能够通过我们的人工智能公链来解决有数据没法数字化、有数据没法深度挖掘的难题,为实体企业赋能,那是非常有意义的。”

区块链里要解决的是“不可能三角”:去中心化、安全性和扩容性。后两者在一个巨大的应用场景下是完全不可能被妥协,那么唯一能做的就是在去中心化上动脑筋。EOS采用的DPoS其实是议会制,可是纵观美国历史,都是Lobby Group(游说集团),各种利益分配的政治团体。所以我更倾向于陪审团制,有一定随机性,可以通过数学公式来表现出来,例如Algorand, MIT教授提出的VRF(可验证随机函数)。当然我们一直很宽容的心平气和的去看各个公司的产品,除了从技术的角度了解、学习,也看他们是如何运营社区。

但因为实在没有能实现我们愿景的公链技术,所以我们也在开发自己的公链,我们会在PoW的W上作文章,把W改成AI计算,把不环保的算力变成用人工智能解决大问题。大公司里有的大数据是非常难处理的,如果能够通过我们的人工智能公链来解决,为他们赋能,那是非常有意义的。以下是我们开发的开源企业级AB2C平台:

为了Cloud-Native云原生我们开发了一个Key-Value Store的component叫Elasticell. Key-Value是最基本的一个数据存储格式,虽然现有的Cache,Radis都很好了,但我们设计的这个component是为了跨云的强一致和高性能,好比这两天刚发生的阿里云故障问题。云系统里面临的情况其实很复杂,当系统出问题时,保证数据不丢失是很难的。我们采用了RAFT的共识机制做了这个分布式的数据库。

区块链是在不可信的环境里提供可信的结果,节点可以是恶意的,而云计算里常用的PAXOS、RAFT的共识机制是无法防止恶意节点,但是我们可以在云环境,在企业的环境里运营。联盟链会是我们的一个子集,我们的数据库更像是IPFS。未来海量的数据下载,比如上亿级别的人脸识别,存储,如果没有足够的TPS是无法处理的。目前我们已经有很好的解决方案了。 第二个问题,分片的问题,如何让其中运营的智能合约,全球同步,没有时间差,得出一致结果是所有公链都面临的问题。目前我们可以看得上的也只有Algorand,但是他们对分片的解释不是很清楚。同时他们要求智能合约的发起方参与共识,这都是个问题。Intel出了个Proof of Elastic Time,根据硬件指令作为最后写入合约的参考。Fabric新版1.0开始,取消了PBFT,采用Kafka order service, 通过分布式的消息处理,根据order timestamp来保持同步性。但是Fabric也只能存在于联盟链体系里,因为他们无法防止恶意节点。

所以要能挑战这么多的问题,需要的是一个真正懂分布式的技术团队。

Part 3:中国人民银行数字货币研究所所长姚前日前对分布式账本发布了一个非常有指导性的文章,其中提到DLT与大数据分析,云计算,人工智能等科技的融合很可能成为未来账本技术的发展方向。

姚前对区块链的研究是非常深刻的。他很早就意识到区块链是可以帮助到实体经济的,同时区块链3.0对TPS的突破必然导致大量数据的产生,这又回到了大数据的问题,团队有没有处理大数据的人才。而且未来不仅仅只是团队上的合作,技术上也是要能够支持,因此引发了我们搭建AI Blockchain的想法。人工智能的价值在于数据和模型,模型成立以后如何调用,变现,把大家的利益整合起来。

比如我们让大家贡献数据,像征信黑名单的共享,针对数据的准确性建立奖惩机制。另外比如FCoin的出现它颠覆了一种经济模型,我们希望能整合出一些有价值的经济模型。还有Hyperledger Parameter的计算使用,把数据分配出去计算,即使计算的结果是不可行的,这个结论本身也是有价值的,是值得付费的。

现在为分布式设计的硬件有Trusted Execution Environment (TEE), Intel从2015年开始使用的Software Guarded Extensions (SGE),这两者是从硬件里保护,可以做到分布式计算里的数据不可能被看到。我们会与一些可以提供高端GPU的芯片生产厂商进行合作,当我们做好了计算引擎,把框架定式,采用这些厂商的GPU。 那么企业可以通过购买几台这样的机器,连接到我们的AI云链上。

一个学术上的东西如何落地到实体经济,不仅要考虑可行性,还要考虑法务财务上的问题,做好成本控制是很重要的。比如我们会考虑用边界计算(Edge Computing)的方式来消化掉不必要的成本,把更多的计算分摊到边界的设备上,采用更便宜的ARM芯片来进行优化。

数字化实体店开张,每个商品都有RFID

Part 4:当你能从视觉的角度看到看到Block Explorer…许多Data Scientist就会更积极的参与进来…我相信通过token economy奖励talents人才对社区的贡献会是未来的方式。我们希望做的是一个动态的生态平台,一个AI Exchange,可以交易数据、模型、算力。

我们找了一家新创云公司,做bare metal servers物理机,我们把真实的大数据,把Docker容器云布上去,用Jupyter Notebook做大数据分析,提供iPaaS的界面。在Data Science的引擎里我们是可以看到结果,在区块链里,你能看到Block Explorer。这些平台式的工作让许多Data Scientists更积极的参与到社区来。他们通过贡献的数据,模型,根据调用的次数获得奖励,这样我们就会有取之不尽的人才。 公司可以很容易的把问题打包,分发出去,用我们的机制再把反馈拼起来。

这对于大公司来说,做公司内部的数字化改造,自己员工的升级,和引进新鲜血液, 来增强公司的中长期竞争力。对于人才的储备,我们可以不局限于公司内部,而是社区也可以做贡献。我们目前也积极地与国内外各类黑客马拉松团队合作。

我们希望做的是一个动态的生态平台,一个AI Exchange的交易平台,可以交易数据、模型、算力。