A计划第一期:基础架构软件创业之道主持人
刘超,创业者、投资人。
原阿里体育CTO,管理技术和产品团队。
原Google工程师、产品经理。于13年创办乐动力,打造超百万日活运动社区,后被阿里收购。
19年9月参与创办AtypicalVentures。
刘超:
A计划是AtypicalVentures为创业者们举办的系列圆桌活动,邀请每个行业独角兽企业创始人为创业者们分享洞见与经验。今天到场嘉宾是AtypicalVentures最喜欢的一群人之一:会做管理并有商业头脑的极客。Geek不只局限技术,他们往往深入研究问题到极致、优化解决方案到极致并以此为乐。一旦Geek插上商业视野与管理能力的双翼,将可能成为最出色的CEO。在座四位嘉宾是真·Geek,他们做云计算、大数据、AI平台、存储系统,他们的产品一定程度上也体现了程序员的情怀,同时具备巨大商业价值。上个世纪80年代开始,基础架构软件领域已经群雄逐鹿,Oracle依靠基础架构上的创新成长为超级独角兽。新世纪后的Amazon和阿里巴巴也依靠Iaas、Paas为公司带来第二、第三的成长曲线。近十年来我们耳熟能详的ElasticSearch、Spark、MongoDB、Kafka等开源架构软件背后都有很成功的商业洞见。因此本次AtypicalVentures组织的A计划活动将请各位和观众一起围绕计算、存储、数据以及他们所蕴含的商业价值展开讨论。接下来把时间交给他们。
01
—
分享人:
季昕华,UCloud创始人。历任华为公司安全团队负责人、腾讯公司安全中心副总经理、盛大在线首席安全官、盛大云计算公司CEO等职务,具有多年的安全管理、产品研发、企业运营工作经验。UCloud在年首轮融资时获得AtypicalVentures创始合伙人投资人卢蓉支持。年1月,UCloud成功上市成为科创板云计算第一股。
季昕华:
谢谢Ruby,谢谢刘超。非常开心有机会能和大家交流。Ruby是我的贵人。Ruby一直说让我来给大家做个分享。但是她说大家都知道创业非常辛苦,让我不要讲一些大的东西,更多让我讲讲我不开心的事,让大家开心。所以我想讲讲我整个创业过程中的困难和挑战。其实我想可能大部分软件创业者不管在跟投资人沟通、客户沟通,还是跟记者沟通时,都会被问到一个灵*拷问的问题:如果阿里、腾讯、百度做了你的事,你怎么办?
其实我也是一样。最初我出来做云计算的时候,那时阿里腾讯都已在做了。所以我比大家更惨。结果是什么?我最初去融资时大概见过一千多个投资人,他们觉得团队不错,但问我如何能够和BAT竞争?我当时一直没有很好的答案,所以导致了什么?我喝了多杯咖啡都没融到资,只好把自己的房子卖了,自己做自己的天使投资人,史上第一傻卖房创业的典型。中间幸好遇到Ruby。年成立公司后,年我们产品面世接了不少游戏客户。Ruby常说自己是技术小白,但却能透过技术底层看到我们。我记得很清楚,当时在上海,Ruby没让我喝咖啡,我就点了一杯Mojito。这杯Mojito让我遇到Ruby,遇到我的第一个投资机构。特别感谢当初的相遇,有了今天的UCloud。
今天我想主要给大家讲如何和阿里、腾讯、百度去PK。可能在座很多创业者都会遇到同样问题,会和我一样被灵*拷问。经过这么多年的尝试和摸索,我也做了一些总结。我希望把这些思考分享给大家,希望各位在过程中能够给我更多的指导和帮助。
我们认为创业公司和BAT其实有三种关系,分别是独立的发展模式、从属的发展模式、竞争的发展模式。在这里借用知名科幻小说《三体》的比喻:三体里面有三颗非常大的恒星。其实互联网行业也一样,有阿里、腾讯、百度这三大恒星。创业公司很容易被恒星吸引或灭掉。
创业公司在做的时候首先要分析BAT的战略。我这里列出了阿里、腾讯、百度的生态体系和他们的整个模式。
阿里围绕“让天下没有难做的生意”,从电商开始扩展到广告支付、物流、运算及金融。需要流量、市场、技术、数据、行业模式。刘超很幸运,当初打造的乐动力有一百多万日活,这部分是阿里非常喜欢的流量,所以进行了投资并购。百度其实相对来说比较不同,先从搜索进入移动市场、收购了91,后面做糯米、O2O,再到今天转向AI。腾讯战略很清晰,从社交获取流量,通过内容变现,所以由游戏、文学、视频拓展到支付和云计算,也需要流量、内容、市场、技术和模式。
有了这个图,我们就知道阿里、腾讯、百度都需要什么。这让创业者可以用非常好的模式去站队、被收购或利用竞争关系获取生存空间,类似三国杀。三国杀局势下如何生存发展,就有可以讲的故事了。
创业公司开始创业首先要需要找到新的机会,这里面有七种模式。
1.新的人群。比如快手。
2.新的市场。比如海外市场,其实BAT发展得不是特别好的。
3.新的技术。比如AI、PingCap为代表的数据库等。
4.新的模式。比如拼多多。
5.新的行业。比如无人机。
6.离互联网较远的行业。比如农业的褚橙。
通过把握这种新的机会点,容易得到快速发展,从天使到A轮、B轮都比较容易实现。因为这是新的市场,很容易拿到资本支持。但当你拿到B轮之后就会遇到一个挑战——
一般在B轮之前创业公司是可以充分竞争的,但是当B轮之后就进入了BAT视野中。这时候BAT就会问你一个问题:你要不要被我投资?如果要,我可以把各种资源给你。但如果你不要,那么我就投你的竞争对手。
所以这时候创业公司就面临选择:到底是想做从属发展还是选择竞争发展?目前的情况来看,大部分公司都会选择从属发展模式,而很少公司能够进入竞争发展模式。那么接下来我会详细介绍的这两种模式。第一种模式要从属发展,它的核心是认清定位,获取资源协同发展。
这里我把从属发展分为四种模式。
第一种模式叫做顺合模式,就是围绕着BAT生态做BAT生态链的补充。比如如涵是围绕淘宝来做的,就可以迅速做起规模。但是遇到的挑战是规模很难做得更大,会有天花板。从我们过去的经验来看,一般能做到亿人民币左右市值,再往上就有难度。因为BAT作为大恒星不希望你做大,特别是不希望你跳出它的生态圈,走到另外一个生态圈里去。这种模式我们称之为顺合模式,它的优点是非常快速、可以非常好地利用整个BAT资源,但发展的空间会遇到瓶颈。
第二种也很有意思,叫做逆合模式。做BAT一方中的对手,然后获取另一方的支持和合作。比如我们知道阿里是做电商的,腾讯自己做电商做得不好,所以创业者做一个好的电商就可以被腾讯投资去跟阿里PK。比如说像唯品会、京东、拼多多这种都能够获取腾讯投资。而如果创业者想获取阿里投资,可以比如做好一个社交软件、做好一个搜索引擎。我们称这种为逆合模式。逆合模式的好处是你的投资方会把你当作打手,会给你很多弹药作支持,但是你的生存或者死亡不是他的事。投资方的目标是通过你来打对手。
第三种竞合模式,难度比较大,是吸引BAT两方或者三方的参与,然后从而获得支持。滴滴就获得了阿里投资和腾讯投资,是因为是双方都需要通过滴滴来发展移动支付的业务,所以它的规模就会大很多。但难点是你要协调关系,同时引入两方或多方的整个支持。
第四种我们称为流浪模式,类似于《流浪地球》。典型是美团。美团最初被阿里投资,但是随着美团快速扩大,王兴想拓展更大的业务比如支付。阿里不想他做支付,所以美团就从阿里星球,逃出来进入了腾讯星球,所以现在美团规模就非常大了。那么这种模式难度非常大,只有王兴这种厉害人物才有可能做起来,而且获得很大支持。
这四种我称之为从属模式发展。它的好处是可以快速发展起来,但困难是可能会遇到瓶颈。当然如果你要有流浪、竞合模式可能会好很多,所以各位如果要创业,可以仔细分析一下阿里、腾讯、百度生态,进行合作的把握和竞争的把握。
比如说像阿里需要的是市场,如果有创业项目海外市场做得非常好的话,完全具备被投资的可能。如果你做社交做得非常好,阿里也可能会投你。所以选择一个好的切入点,很容易获取了投资或者并购机会,实现快速套现。像我们成功的刘超刘总通过乐动力,快速被阿里投资并购,所以他现在成功地成为一名投资者,而不像我们很多创业者还是苦哈哈做创业。
第二种我们称之为竞争发展模式,这种难度比较大,需要具备强大的战略,组织、投融资、国际化和品牌能力。非常典型的就是头条,头条通过它非常强的战略、特别强的组织能力以及投资关系能力,成为现在BAT之外一股不可忽视强大力量;或者说由字节跳动取代了百度的B,成为新的BAT。大家可以深入去研究一下。
最后,我们是怎么做的呢?一个我们坚持中立,不被BAT投资。带来什么好处?比如说做电商的不太敢用阿里云,做游戏的不太敢用腾讯云,做手机的不太敢用华为云,就可能选择我们。第二是一家公司如果需要多个云来做支持,就是我们的机会。因此我们内部自诩为我们叫“云备胎”。各位如果不敢用阿里腾讯用百度的,那么用我们UCloud是一个好选择。第三是我们深入行业来提供更好的支持和帮助,这是我们简单的、也是最好的一个策略。
总结下来我们认为创业公司要和腾讯阿里百度竞争的话,各位可以从新人群、新市场、新技术、新模式或者新行业,这五个方向或以一个比较远的行业切入进去,通过前期市场化的充分竞争成为领头羊之后,进入到B轮。这时候阿里腾讯百度找到你,你会选择从属发展或者是竞争发展。如果选择从属发展就要去分析整个战略需求,决定是用顺合模式、逆合模式、竞合模式还是流浪模式。当然这和你的选择相关,如果你想快速套现、快速上市,顺合模式最好的,但规模有瓶颈。逆合模式帮BAT当打手套现较方便,但上市有难度。竞合模式规模很大,需协调多家关系。流浪模式难度很大,只有美团较成功。
除此之外,竞争发展模式是难度很大的路径。但好处是只要做出来就是下一个BAT。就是《三体》里面的下一个恒星。它需要有刚强的战略、组织、投融资、国际化等能力。经过八年的努力,我们在年1月20号上市,成为全世界第一个独立上市的云计算公司,也是中国A股市场第一个同股不同权的公司。想和大家分享三点。
1.创业公司很辛苦。技术创业很辛苦。感谢有Ruby这样的投资人,能有AtypicalVentures这样的投资机构支持。我们的上市给大家一个信心:即使大家像我一样做技术出身,在有投资人支持下,只要坚持做,在中国,特别是科创板的机会下,做科技公司还是有机会上市的。
2.我想特别跟大家讲,我是一个农民出身的孩子,我的父亲在我很小的时候去世了,我没有任何背景。我想说在像我这样一个没有任何背景、家庭情况非常不好的一个苦孩子,在中国,只要我们努力做好技术、做好服务,也是有机会上市的。
3.我也特别想跟大家分享是什么,虽然在中国BAT三座大山的压力下,只要我们努力去做真正的价值,不断为用户创造价值,也是有机会逐步发展起来、不会死的。就是说在BAT竞争下,我们也有机会活下来。
我觉得上次说明这三点,虽然创业过程很苦,技术人员创业更苦,但是我觉得核心是抓住自己的优势来为用户创造价值,在困难情况下能咬牙坚持下来,在优秀的投资机构的不断支持下,我们还是有机会发展很好的。这就是我们公司的一个文化叫做优秀是刻苦努力得来的,这也是我们公司优刻得三个字的寓意。谢谢大家!
02
—
分享人:
PingCAP联合创始人*东旭。*东旭曾就职于微软亚洲研究院、网易有道和豌豆荚,是开源项目Codis作者、TiDB设计者。除了PingCAPCTO的身份外,他是一位黑客、摇滚乐手和程序员。PingCAP致力于探索并逐步解决分布式数据库领域问题,曾获得云启、复星、晨兴、华创、经纬等机构总计超过万美元的融资。
*东旭:
听完老季的分享真是感触颇多。作为前辈,老季的故事给我们所有人带来鼓舞。其实PingCAP属于一家新生代的公司。在过去的中国很少有这样的公司出现。PingCAP是一家做开源分布式数据库的公司,主要和唯一的产品就是TiDB。从公司诞生到现在正好5年。整个公司个员工分散在全球各地,是比较典型的开源软件公司。
其实在5年前我们刚开始创业时候,中国应该说还没有任何一家成规模或者体系完整的开源软件公司出现。我们应算国内最早一波去用开源软件做创业的公司,这个过程中也摸索了一些如何在中国做世界级开源软件的打法、策略,会跟大家分享。
然后其实刚才我看到老季talk里面有一点,我觉得说的特别好:如果想把这个公司做大,我个人觉得不要去害怕跟BAT去做直接竞争。PingCAP或TiDB在领域里主要的竞争对手其实也是阿里、腾讯等国内巨头企业。我个人的经验就是当评断一家公司或者说一个产品实力,有时候并非由你本人说辞决定,别人会去看你的竞争对手是谁。如果你的竞争对手都是BAT,其实你自己某个程度上也就是“巨头”。所以有时我会觉得你的竞争对手定义了你。对于新一代基础软件创业者来说,不要去害怕,反而说在如果你发现你的竞争对手已经没有创业公司,全都是巨头了,说明可能你自己已经挺厉害的。
TiDB是一个数据库。今天很多听众是工程师,所以大家可能用过。MySQL是全球最流行的开源项目之一,大家在自主架构里面使用MySQL的很多。但数据量大了以后,它的扩展能力就变成问题。所以过去在TiDB出现之前,大家可能经常会使用分库分区、MySQL中间件等方案。5年前我出来创业前在豌豆荚,当时我们也是重度MySQL用户,遇到一个问题就是MySQL分表业务层面非常不灵活,很多功能包括跨分片做join或transaction没法搞。我们当时就在想能不能从零开始去设计一个数据库像MySQL这样易用,对于用户来说使用友好,同时又拥有像NoSQL那样无限的水平拓展能力。这样对于用户来说,既保持了业务快速开发,同时又能承受各种scale,这是TiDB的初衷。
当时我们也看了谷歌的一些paper,觉得这个方向还没有一个开源软件做,而这项技术可能会开启未来的数据库市场。所以我们就跳出来说:我们要去做这个方向的开源软件,去解决程序员们的问题。它并不是MySQL或者基于一个MySQL的封装,它是从零开始的新东西。它并不是一个MySQL的分支,并不是类似像HaSQL、Hadoop的分析平台,而是一个分布式数据库。而且它是百分之百的交易型、分布式分析的、实时分析的数据库。
对于一些没有听说过TiDB的小伙伴,我简单说几点优点。
第一点这个系统能够水平的无限扩展。对于你的业务来说,无论你的业务的复杂性有多大,或者数量有多大,你只需要往集群里面简单加机器,就可以无限扩展。整个过程你不需要人工去做重新分布或者重调整的。
第二点在大规模的集群下,通过先进分布式算法让系统拥有自我恢复、高可用能力。就是说当系统节点出现故障时,业务层完全透明,可以自我恢复。
第三点是支持强一致特性,简单来说就是它可以用来做银行核心的交易。其实这也就是为什么TiDB的大绝大多数商业客户都来自金融银行这样行业,这也是过去像MongoDB、NoSQL没办法去触碰的市场。
第四点是业务层MySQL协议兼容。如果已经是依赖MySQL代码的场景,基本不用改任何一层代码就可以去直接migrate到TiDB,数据迁移成本几乎是零。本身TiDB就是一个混合负载型的数据库。
其实我们的数据库主要有两种应用场景。
第一种当核心的MySQL数据库出现了性能、并发、数据量瓶颈时,可以无缝迁移到TiDB去支撑业务快速增长。比如TiDB早期第一个大规模商业客户其实是MoBike,MoBike在他们公司很小的时候就选用了TiDB,在他们业务高速飞速增长的时候,他们的基础架构数据库层面上基本没做太大的变化,就帮他们一步步地从思路上解决了scale困境。
第二就是TiDB本身是一个分布式的架构,所以可利用整个集群计算资源去做数据实时分析。这个在银行对账实时风控场景应用很多,是一个generalpurpose的database。
那么,为什么要选择TiDB?
首先,我们是国内最早通过opensource(开源)模式做起来的公司。大家知道CNCF(CloudNativeComputingFoundation)是全球范围内云计算相关的最重要的基金会之一,大家耳熟能详的gRPC等基础云计算相关技术都是该基金会旗下的。
我们公司在CNCF里是全球第六大贡献者。第一名是谷歌,前10名里唯一一个创业公司就是PingCAP,而且我们也是在这个列表里面为二的两家中国公司之一,另外一家是华为,我们在第6名,华为在第7名。某个角度说,最近这几年在国际开源社区里PingCAP是一股不可忽视的力量。
TiDB第一个版本发布到现在正好三年时间。但是第二点是,开源软件有意思的地方是三年内我们得到了超过家生产环境用户量,基本上是指数级别增长。这跟开源软件特性有关:它的传播是非常高效。当你这个产品稳定又比较好用,就会口口相传,遍布国内国外。比如日本最大的支付公司paypay,比如微众银行,比如北京银行,比如法国最大视频网站之一Dailymotion等都是我们的客户。我们对于过去老业务的兼容会做得很好。
第三点是分布式数据库可以弹性水平扩展。
第四点就是说性能好。
第五点我更想强调的就是说TiDB或者说我个人愿景是希望能够去做一款软件“像iPhone一样”。比如说大家想象一下,在iPhone出来之前,打电话要用诺基亚,我们拍照用佳能,去野外要用GPS可能还要另配一个GPS设备,但是有了智能手机,所有需求都在一个手机里面解决掉了。我希望TiDB能够在未来能变成这样级别的一个开源软件,用一款软件能统一所有的功能。
03
—
分享人:
OneFlow创始人袁进辉。原微软亚洲研究院主管研究员,搜索早期成员。-年于微软亚洲研究院从事大规模机器学习平台研发工作,年研发出当时世界上最快主题模型训练算法和系统LightLDA,被应用于微软在线广告系统。OneFlow致力于打造下一代分布式深度学习平台,是一个直接挑战GoogleTensorflow和FacebookPyTorch的项目。公司成立于年,共完成三轮共计数千万元的股权融资。
袁进辉:
大家晚上好,很高兴有机会来和大家分享一些我创业过程中的心得。因为我们在搞深度学习框架,从刚开始做到现在一直面临外界疑问,就和别人问老季云计算问题一样:Google在做、Facebook在做、国内百度在做,你们创业公司人少钱少,怎么去搞?怎么能打败别人?
我今天就大概分析一下我们的想法,所以取名字叫“突围之道”。我们公司非常年轻,是今天几家公司里最年轻的。我早就认识东旭,我们在有道中间也算同事,在微软也是院友。我创业实际上是受他的激励、PingCAP也在以开源的形式做。我年年底从微软研究院离职,到现在三年多的时间,拿过三次融资。前两年其实没挣钱,一直在做产品研发。我们没有在刚开始研发的项目就开源放出来,一直研发到现在,终于快开源了,一个月内OneFlow就会开源。大家马上能看到我们努力的成果。从去年开始我们在闭源情况下做了一些商业化,合同收入超过万,有一些比较大的典型客户。
首先我们看一下框架在整个人工智能行业里面的位置。最外面一圈是各种算法和应用,再往中间一点就是云计算。不管是应用层还是云计算,其实底层使用的技术是相通的,芯片使用如英伟达或其他AI芯片,基础软件就是深度学习框架。所以有的人会把深度学习框架比作人工智能的操作系统,我认为这个比方是比较贴切的。
我也从网上找了一些关于现在深度学习框架市场占有率的情况:一个是左上角找工作时框架选择热度,右上角是CSDN做的一个调研,左下角是Github的star数量,右下角是在学术论文里面的使用情况。大家会看到PyTorch增长非常快。而因为历史的原因,可以看到TensorFlow点赞很多,积累优势也较大。现在大家会说TensorFlow在工业界用得比较多,在学术界是PyTorch较多。
如果做一个框架盘点的话,你会看到一些老一代的框架,最早的是Caffe、Ciano,逐渐淡出了历史舞台,包括微软做的CNTK也在列。国内的框架最早的是paddle,由百度16年开源,今年有几家国内企业也加入战争,包括3月份开源自研框架的旷视、华为以及马上要开源的OneFlow。虽然框架是很新的事物,但它的更迭非常剧烈。你看Caffe、Theano到现在没超过10年历史,但逐渐因为基础落后或其他原因被淘汰出去了,成为上一代的技术。然后又出现譬如说MxNet,Paddle等新框架。总之在市场上留下痕迹的,或是处在收敛路径、处在赢者通吃局面的就是TensorFlow和PyTorch两种。
如果说他们的特色的话,TensorFlow非常完备,应该是世界上最完全、最完整的框架。PyTorch则是业界公认最容易使用的框架。回顾历史,我们会发现,如果框架没有特别鲜明的特色就会非常难以出头。而我们OneFlow又会从什么角度在铁板一块的市场格局情况下在杀出重围呢?这个会在后面探讨一下。
我不想用太的时间来渲染算力效率的重要性。深度学习的发展历程从15年到现在,刚开始比较活跃的是算法创新,但是从17年到18年之后,很多给人留下比较深刻印象的技术突破基本上都是“大力出奇迹”类型的,就是算法的新鲜度没有那么强,更多的是它使用更多的数据、更多的GPU。所以在这种情况下就会看到说哪个公司能够掌握算力的顶点,它的品牌上、技术上就有很大的优势。
年-年BERT算是业界最大模型。而从今年开始就可以看到是BERT的10倍到倍的模型出现了。在前段时间,微软出了世界上最大的Turing-NLG,用语言模型做翻译处理自然语言处理,有亿参数。一个月之后,OpenAI就出来一个GPT-3具有0亿参数,是整整10倍。然后训练这一份模型需要多少钱呢?有业界同行估计需要1万美金,此类科研的意义就像放火箭一样。而且OpenAI现在把这个东西做成一个商业服务放出来了。所以说现实中算力非常重要。怎么去实现这种级别的算力呢?
我们大众听到最多的答案是芯片。如果CPU不够就去用GPU,GPU还不行,我TPU、寒武纪等其他芯片能做出来。但实际上单个芯片是有物理限制的,比如说它的制程、面积和功耗。现在不断有新的芯片问世,但英伟达最新款一旦面世往往立即变成最强芯片。创业者在当前物理工艺限制下想做出能超过其他芯片10倍性能的新芯片是非常困难的。而要获得刚才提到那种成百上千倍的算力,就难以从芯片层面解决,而要从系统层面解决。当前业界通用的做法是,把很多芯片连起来插在一个服务器内,把很多服务器通过高速互联网络连起来变成一个芯片池来解决这个问题。在这种情况下,它最具有挑战的问题就变成了软件框架。我们通过一个什么样的软件,能够让用户把芯片集群非常高效率的利用起来?除了OneFlow,其他框架在这个层面的探索都是非常初步。
从用户体验的角度来说,我列出了最重要的几个特征,也凭主观做了一下各个框架在三个维度上的优劣对比。一个是完备性——TensorFlow已经做到了,Paddle的完备性也非常高。毕竟是大厂有钱、有人可以把东西做得非常圆满。第二个是易用性,PyTorch是易用度非常高。即使它的做法已经公布,其他框架去学习它到现在还追不上它的易用度,因为会有历史依赖、路径、原来架构的限制等问题。第三个是效率。高效性应该说所有其他框架做得都不够好。那么OneFlow想法就是说我们要做世界上最快的、效率最好的框架。完备性、应用性和效率比起来,哪个问题最难?以我做技术这么多年经验说,我认为效率是最难的。但应用度、完备性是我们需要去追赶的一个方向。
我来打个比方,就像爬山。我们观众里有没有爬过珠穆朗玛峰的?大家知道攀登世界最高峰最经典的路线有两条,一个是中国这边的北坡,一个是尼泊尔边的南坡。
大家有没有了解过从北坡爬的人多,还是从南坡爬的人多?实际上从数字统计来说,从尼泊尔去的人多。看上去好傻,明明看上去北坡好爬为什么去南坡?
因为从尼泊尔南坡爬的成功率高。为什么呢?可以看一下地形,北坡从中国境内一直走到很高的海拔,到米海拔米海拔,可能就像观光一样,比较容易上去。但是再往上走就有五六个很容易挂掉的节点,非常陡峭、风很凶猛,在这个地方失败概率很高。南坡只在三四千米海拔的时候有一个有冰川,叫昆布冰川,会遇到不少风险,可一旦越过这个之后,再往上爬的时候,就平顺很多。我举这个例子的目的是什么?我们现在和世界上最强的框架对比,处在一个什么阶段呢?相当于,OneFlow是从珠穆朗玛峰的南坡来爬,首先经历了、解决了最困难的问题,刚刚度过最困难点时刻的海拔是比TensorFlow和Pytorch低的。Tensorflow和PyTorch这两者爬的高度很高了,可他们之前的路是相对容易,马上要去面临最难的问题。这种局面下谁会最先爬到山顶?我认为我们会最先爬到山顶。解决完备性等问题,再去解决高效性的时候难度非常之大。而我们先解决高效性的问题会使攀登路途变得容易。
04
—
分享人:
李浩源博士是Alluxio公司的创始人兼CEO。Alluxio(原名Tachyon)开源项目是李浩源博士在加州大学伯克利分校AMPLab攻读博士学位期间,联合创建开发的开源分布式超大规模数据编排系统,目前世界前十名的互联网公司中已有八家在使用Alluxio。,李浩源同时也担任了Alluxio开源社区主席和ApacheSpark成立委员会委员。李浩源获得了北京大学学士学位,康奈尔大学硕士学位,以及加州大学伯克利分校博士学位。Alluxio成立于年,总部位于美国加州,曾获得AndreessenHorowitz,SevenSeasPartners,VolcanicsVenture等机构总计超过万美元的融资。
大家好!很高兴和大家分享。我们的愿景是希望可以编排数据,为大数据、AI、ML、DL这种数据驱动应用大幅提高效率。目前我们有上百万download,也入围了Github个最有价值的项目之一。
然后我们主要做什么?大背景是在整个数据生态领域有很多数据应用。比如说传统大数据分析像Spark、Presto、Flink以及新型的Tensorflow、PyTorch等AI/ML的各种框架。我们发现大约每5年在数据驱动的应用上就有新的创新框架,从存储的角度来讲每10年有很多新型的存储系统。传统角度有IBM,NetApp,HPE各种各样的公司,也有像亚马逊的s3,国内的阿里、腾讯、百度各种各样公司。在比较复杂的生态系统环境下,如何有效的利用这些数据,对于大公司来讲是很大困难。如何使得在大公司中每一个很小团队都有效利用这些数据,对于企业来讲是一个挑战。
从这个角度来讲,我们看很多的这些公司数据应用数据分析的历史。它最开始的时候是20年前、15年前这种传统的MapReduce、HDFS框架,慢慢的他们也从严谨的框架变成了分离的计算和存储。而到今天演变成更复杂情况:有各种各样的框架,在不同的数据中心,或者是存储在自己的本地、计算在云端,又或是说企业想把数据大部分挪到面向对象的存储环境里面。环境越来越复杂。在这个环境下如何让你所有的计算可以很有效的、很简单地使用到你所有的存储里面的数据是巨大挑战。
在历史上有很多种公司都尝试解决这个问题。而解决这个问题的方式都是说:我们是不是重新构建一个存储?如果我们重新构建一个存储的话,只要我的存储足够好,我就可以让我的用户或者说我的客户把他的所有的数据都迁移到我的新的存储里面。这个想法其实是蛮好的。但是这种DataLake的10年前的概念也是蛮好的,但是这件事情用这种方法尝试解决在整个存储领域已经做了40年了。从来有成功过。这个道理很简单,因为每五到十年,存储领域本身也有新的创新。有新的系统,会用同样的故事跟用户来讲一模一样的话:我的存储更快、更好、更高效。所以有些用户会选择新的存储。也因此这种方式从来没成功过。根据历史经验以及整个业界的发展,我们也看不到这种方式的成功可能性。在Alluxio我们是采用了一种完全不同的方式,我们称之为dataabstractionapproach:在计算层和存储层之间构建一个新的层,叫dataobservationlayer。这一层的用处是把所有不同的数据在不同的存储系统里面、不同的存储的这种部署里面抽象化、虚拟化,把这些数据编排起来,提供给上层大规模分析或人工智能应用也好,使上层的系统更有效地利用下层这些不一样环境里的数据。
其实这个方法在历史上其他领域也可以看到。比如说在本地存储,我们也可以看到类似的方法,大家可以想我们的本地的PC机也好,笔记本也好,里面有不同厂商的SSD(固态硬盘)或者HDD(机械硬盘)也可以连接到不同厂商的NFS。但是从用户的角度来讲,你看到的只不过是一个本地文件系统的文件夹和文件,所以你也不关心你下面用的到底是希捷的硬盘或者是因特尔的硬盘。因为上层已经帮你做好了抽象化。而我们采用的方式,其实就是在数据中心和跨数据中心上采取了一样的思路。这个也可以类比到container领域的Kubernetes。功效是说如何使一个大规模的计算资源得到有效利用。
Alluxio使这种大规模数据有效得到利用的应用有很多。今天我们可以举三个简单的例子,第一个比如说如何在单个云环境里做加速;第二个是混合云场景(数据在自己的数据中心,而计算跑在云里),无论出于安全、效率还是cost的角度。也是很流行的使用场景;第三个是如何在面向复杂存储情况下,高效使用新型计算应用。
有一些大型的银行金融公司、电信部门已把Alluxio作为一个整个数据平台的核心软件,所有的计算都要通过Alluxio最后找到用户,这是属于比较高级的使用案例了,不展开讲。像刚才说的这种混合云和多云的情况,有各种各样的案例。现在还在疫情期间,我们看到有些客户取得2倍到10倍的节省开销、10倍的计算性能提升、4倍商业效率的提升。同样一个人做同样的一个事儿,原来需要一年,现在只需要三个月。然后在国内我们社区也出了一些关于技术书籍,如果听众有兴趣的话,欢迎阅读,一同参与到社区建设中来。
问答环节
刘超:
首先我提的一个问题代表我们基金。我们发现基础架构软件前期研发投入时间非常长,资金量要求也很高。虽然这样从长期来看非常正确,能够为这个公司有建立更高的技术门槛。但是在早期的时候,请问各位创始人是怎么做好在深挖技术门槛和商业变现之间平衡的?
*东旭:
其实我们的经历跟你刚才说的模式还挺像的。一开始头几年完全很多精力和资源投入研发,但是这两年开始去发力做商业化,而且正在规模化商业化的路径当中。
所以我这边我说一下我们最早的一个“为什么这么选择”背后的一个想法。
首先我觉得基础软件,特别是database这样的这种行业,它的价值或者门槛在优势还不明显时挖不到。打比方说它就像一个井一样,你可能在一开始特别不稳定时候贸然去做商业化,反而会对你本身的品牌、对你的客户带来伤害。这个费力不讨好。就是说我在早期我可以咨询外包等方式去赚到一些钱。但是你回头来去看,这些钱对你整个你的竞争力、后期核心壁垒的建立没有任何帮助,这些钱反而不应该去赚。
所以比如说我拿到投资人的钱以后,其实第一件事情就是想怎么通过这个钱来去构建我的真正的壁垒或者竞争力。如果我拿这个钱投到销售里面,特别是在早期,其实仔细算算是亏本的。你投到技术这边其实才是从长远来看是更赚的事情。但到达一个阶段了以后,你就会发现当你技术软件的产品(特别是开源软件)一旦到一个拐点了以后,它的增长曲线是指数级的。所以包括我们现在做商业还是动作非常谨慎,因为我一直觉得如果最后你要一年挣1亿美金2亿美金这个量级,你现在的产品和你的团队有没有ready呢?所以我现在做收入,其实也还是在围绕我的技术、我的客户等一些门槛去做构建,并不是说我已经要去获取规模化利润。
我拿来的钱到底要对我长期的竞争力构建扮演什么角色?我觉得大家都这个想法。
刘超:基本告诉我,就是说首先第一个投资人你不要在乎我现在挣多少钱,我现在做收入也是为了做产品,所以不要在意这些细节。(笑)第二个就是说我不该挣的钱不要挣,因为这个会让我们减慢速度。只会有选择地去挑选客户,才能够一边把钱挣了,一边把产品做好。请东旭来问下一个问题。
*东旭:我昨天在彩排的时候我虽然没来,但是后来在群里面我问了一个问题,其实这个问题也是最近思考比较多的。因为大家知道这几年开始云其实变成了一个我觉得最重要的软件交付渠道之一,包括AWS、阿里云、UCloud等。其实关于未来,反正我是一个非常相信一切都会走到云上的。所以在这个时代,开源软件跟云或者说开源软件公司跟云是怎么样一个关系?其实这个问题我想抛给老季这边来去从他的角度来去看,云厂商怎么看待开源软件?
季昕华:
我觉得这个问题非常好,也是我们云厂商一直非常