星瀚资本杨歌:用投资的眼光看大数据与AI,能看到什么机会?

发表于 讨论求助 2023-05-10 14:56:27


对于人工智能的理解有一个误区,大家都觉得应用层的发展非常快,但是我认为现在还差一定的火候。应用层依赖于基础层和技术层,这两层还在不断地迭代,什么时候这两层完全成熟,应用层才会实现大爆发。我现在关注比较多的就是技术层、基础层和对企业的应用层,这些都是我们认为会有直接回报的行业。


——星瀚资本创始合伙人杨歌


上周六(11月18日),“数字经济产业发展论坛”圆满落幕。论坛上,星瀚资本创始合伙人杨歌带来精彩的“大数据智能投融资趋势分析”主题分享,从投资人的视角出发,分析了大数据和人工智能的发展情况,指出了现存的问题以及值得把握的红利。


(演讲正文略有删减,小标题为便于阅读而添加)



演讲主题:用投资的眼光看大数据与AI,能看到什么机会?

主讲人:星瀚资本杨歌


大家好,很高兴今天在这里跟大家分享,我给大家带来的主题是关于大数据和人工智能目前的发展情况。


先简单介绍一下我们公司,星瀚资本成立几年的时间迅速发展,在实体行业和新兴的产业之间架起了桥梁,我们最看重的是实体行业和新兴产业之间的连接,能够实现跨界、联合非常非常重要。单纯的人工智能很难直接应用到市场里面去,传统行业实际有很多有待增值的空间,我们需要把两者结合起来,这就是我们寻找价值的基础。


1、互联网基础

提大数据和人工智能先提互联网基础。我们经历了20多年的时间发展互联网基础,这些都是我们所经历的过程,我就不一一细讲了,比如说互联网金融,包括互联网的使用、电子商务、共享经济等等这些都是我们耳熟能详,几乎每天都会使用的东西。



在互联网阶段,我们把互联网行业分成三个阶段,叫做传统互联网、互联网+和互联网智能化三个阶段。


传统互联网从1995年开始发展,到2010年已经算比较成熟了,从低层的网络硬件到上层的互联网建筑,一直都在高度发展。传统互联网经历了几朝元老,比如说从最开始的新浪、网易、搜狐,到现在BAT如日中天的竞争,到今天走过了互联网O2O这个过程,传统互联网已经发挥出了它的价值,格局基本已定。


从2010-2015年,我们主要发展的是互联网+行业。互联网+主要利用互联网的信息化能力,我们经常提TMT,由互联网所产生的技术媒体通信的能力改变很多的传统行业。


互联网+还可以分成两种,一个叫做互联网重+,原来的商业模式从线下全搬到线上去,比如说像餐饮互联网,美团点评、饿了么,比如说像车联网,滴滴、快的等等这些都属于O2O行业。


经历几年的竞争我们发现并不是所有公司都可以做O2O的,很多商业环境是不适合做线上的。于是我们发现O2O只是刚性需求,某一种行业可以去使用,而非刚性需求并不适合做O2O,于是在之后我们开辟了一个新的行业叫做互联网轻+,就是产业升级,能够把传统行业和互联网衔接起来,我们把这个叫产业升级,里面包括很多内容升级,消费升级、企业升级,工业制造业的升级,传统的行业升级。


由于互联网的赋能导致终端的交易可以电子化,让很多的财务可以追溯历史数据,于是很多的供给侧方面就得到了改革,变得更加高效,这些都是由互联网导致的。


互联网的第三个阶段就是互联网智能化,由于互联网的布局从经验变成了规范,变成了数据化,变成了结构化数据,变成了系统,产生了大量的数据库,之后我们便走入智能化。在智能化里面有很多行业,大数据、人工智能、虚拟现实、机器学习、智能硬件等等,这些所有行业都是我们所关注的。



对于智能化来讲,我们一次又一次地认为风口来了,但是发现全都变成了泡沫,然后又跌落谷底。其实这一次浪潮有很多不一样,原因是因为这次整个互联网基础和大数据积累的积淀已经基本完成,所以这次的浪潮是比较真实的。现在我们数据的基础已经收集的比较完善,分成几种类型,我在后面会提到。


刚才我讲到的这些过程就是互联网发展的过程,互联网是一个信息的工具,随后演变成管理工具,逐渐优化成商业模式,改变了周围的交易手段、生活习惯、各个方面之后,推动产业发展,之后变成了金融平台或者是智能化的平台,这就是整个互联网发展的过程。这就是互联网的基础,我们要考虑的是互联网之后做什么。


2、人工智能和大数据的时代已来

2015年和2017年都在提人工智能。2015年正值互联网产业升级的过程,我们还在做各种各样的布局,餐饮互联网和车联网都在打地基。但是到2017年我们会发现饿了么收购了百度外卖,这说明什么?说明产业升级基本上已经完成了,大部分数据已经收集完了。在2017年产业升级已经基本完毕,同时也收集了大量数据的情况下,我们开始更深入地进行思考,目前来讲,这个是一个做人工智能和大数据非常好的时期。


关于互联网推动我之前与大家已经分享过很多次,有些是互联网已经做过的,有些是互联网还没有做的,互联网目前还没有衍生出新生的行业,比如说像区块链,比如说像大数据人工智能,比如说像机器人等等,这些所有的行业都是互联网会继续推动的方向,我们主要看中的讨论的就是大数据和人工智能。


铺垫了这么多终于讲到了人工智能,我们把人工智能分成三个阶段:刚才已经提到互联网基础,还有大数据的积累和算法的应用。


互联网基础可以认为已经是比较成熟的,从硬件到软件到商业模式都是比较成熟的,大数据积累我把它叫半成熟,这个半成熟在什么地方呢?这一半指的是数据虽然有了,但是还没有进行数据开采。对于大数据来讲,数据的标准化、结构化是非常重要的,所以这两年我们最重要的一点是把大数据做成结构化数据。



在大数据之后,还有算法,有了数据,有了素材,你要进行数据分析,用算法分析,对于算法本身来讲,做理工科,做科学研究有很多种算法可以使用,但是商业化的应用还不是特别成熟。


我们认为整个过程里面,无论是最开始制造数据接口还是形成数据都不是很困难,已经基本完成,最难的就是把大数据训练的过程,把人工智能做商业化模型的过程这个是非常困难的。


3、大数据的分类、来源与问题

首先讲讲大数据,大数据是进入人工智能行业的入口,对于大数据来讲,其实非常简单,我把大数据分成三个模块,叫做数据的入口模块,数据的算法模块和出口商业化模块,含金量最高的就是大数据的算法这一块,对于大数据算法来讲就是收集、定义、整理分析、挖掘,最后抽象成一种函数一种模型,这种模型能够加载到商业环境里面去,这就是大数据的使用。


任何大数据在最开始有一个入口,数据必须要有来源,这就是我刚才提的,大数据有多少来源。在今年6月份GPO所出的一份报告称,现有的大数据来源分成三个类型,第一种类型叫做由个人所产生的数据,这里面包括每天写的博客、微博、发的短视频,包括搜索的信息。这些所有在网上可以通过爬虫爬取的数据,都叫个人所产生的数据。这个数据量非常大并且比较抽象,不是特别结构化的数据群,这种数据已经积累了将近30年的时间。


第二个数据类型叫做交易类数据,由于互联网推动了各种各样的电子商务导致线上交易,包括我们在电商上进行买卖;包括使用O2O的平台;包括使用各种服务,这个过程就叫交易类数据。交易类数据非常特殊的一点在于明显反应了消费者的真实需求,我想买什么,想为什么东西买单。从数据上来讲是一个标签化的过程,它叫做半结构化的数据或者比较结构性的数据。这种数据出现以后,我们会发现大数据整体发生了变化,这也是为什么这两年大部分公司都在竞争O2O行业和线上支付行业以及互联网金融行业,原因就是因为市场在竞争交易类数据。


第三个叫做由硬件所产生的数据,比如说像手机、手表、手环所产生的数据,我听说有一些金融公司通过各种各样的手段去收集数据,其中不乏去买废旧的手机,再从中提炼数据。



要想做大数据,必须要有基础的素材,这就是数字化的入口,就像进入到混凝土搅拌机里训练,再进行实体化的过程,这就是数据的入口端,然后是使用数据的训练结果,比如说相关性。


我们使用数据的相关性指导商业,制定用户画像,制定商业画像,调整商业策略。最终实现大数据的应用,比如说《大数据时代》,我向大家推荐这本书,这里面讲了很多案例,最简单的是美国的7-11便利店通过财务数据发现,每一次下雨的时候除了雨伞卖的好之外,蛋挞也卖的很好。这两个东西没有直接的逻辑规律,但是找到了两者的相关性,于是决定把两个货架发在一起,最终实现了1+1大于2的结果。这两个东西放在一起,达到了增值的过程,这就是相关性指导商业战略的过程。


反过来说就是反馈性,将数据计算完以后,对这个商业模型进行检验。比如说前两年有一种智能硬件是车载的行车记录仪,这个生意并不好,一直卖不多,突然有一天保险公司来说,我来收你硬件,你给我记录驾驶员的行为习惯。


把这些数据做成结构化数据之后,保险公司去分析每一个人的行为驾驶画像,通过这个画像上调和下降保费,去看你到底是一个比较安全还是容易撞车的人,这个也是比较典型的大数据应用。但是后来发现,最开始的判断是错误的,最开始判断以为打方向盘猛的人容易撞车,于是上调保费,通过长时间的迭代过程,发现猛打方向盘的人反应速度比较快,不容易撞车,而踩刹车动作慢的人容易撞车。这就是一个比较典型的案例,就是反馈性的过程。


这个过程刚才给大家描述的就是大数据的三个模块,其实非常简单,入口快、算法快和出口快,还有很多应用,值得一提的是机器人的使用也是一样。对机器人来讲最重要的是什么?不是硬件,不是器械,最重要的是这个芯片能不能进行学习。


其实机器人行业从一八三几年就有人开始研究,为什么一直没做出来?原因是因为没有计算机,没有芯片,所以机器人没有大脑。思必驰也好,科大讯飞也好,各种各样的公司都为机器人在不同方向上进行训练,让机器人产生大脑,产生运动机能,这个才是机器人的爆发的前夜。机器人最重要的是大数据的计算。


大数据已经发展了很长时间,总结一下现存的问题。第一个在商业市场里大数据的竞争非常激烈甚至恶劣,一些人为了收集大量数据做恶性竞争,拿钱买数据。我见到一个资金有40多亿的公司,还要花大几千万不断购买数据,这些数据跟之前的数据严重同质化,并没有深刻地意识到买来的数据噪音很多,再去买数据可能是没有价值的。


很多的数据噪音非常非常大,有效的数据比较少,没有办法提炼出结构化数据,数据密集但是孤立分布,很多公司都具备某一个方向上的数据。比如说饿了么具备吃饭的数据,滴滴打车具备出行的数据,但是数据非常独立,非同源的数据不进行交汇,数据结果就不一定智能。


一定要把数据结合起来,放在一起,这个数据才有价值。这两年我看到许多非常好的金融类公司,金融类公司自己不直接生产数据,产生了非常多的垂直数学上正交和各种各样行业的数据,把这些数据放在一起就更加智能。


最后一点,许多大数据公司总想去解决一些复杂的问题,一股脑解决体系化的问题,这是存在很多问题的。对于一个优秀的大数据公司来讲,一定要能够解决主体问题,再抛开常规问题,这是很重要的。


这个是大数据的现存问题,对于大数据来讲,发展进程最开始是开采和收集,然后就是清洗和标签化,这个是数据非常重要的一点,非结构化数据很难进行训练。第三点就是一定要把非同源的数据放在一起进行训练,使整个的矩阵更加丰满才可以。第四个形成结构化的精炼数据集。


4、人工智能的分层以及值得关注的层次

在数据之后就是人工智能的模型化过程。我把智能化分成两个大的阶段,一个叫做赋予的智能,一个叫学习的智能。赋予的智能是指有了计算机以后,利用人工经验不断地推导,再写出程序,让计算机去执行。它有明确的物理意义,能够明确地表达出这个函数是什么,是低阶的比较线性化的特征,让计算机去学习的过程,这个过程不用计算机训练,而是由人直接写成代码完成的。


第二个是人工智能发展最重要的板块,当不明确的意义的时候,当我知道要训练哪些方面,我手上有什么素材的时候,就要进行训练。这两年为什么人工智能大爆发,主要是因为这块,因为机器的算法越来越多,硬件速度越来越快,导致有很多的模型都可以去做。


人工智能好不好,第一个方面就是硬件够不够快,第二是数据够不够大,第三就是算法够不够好,这些都是指在学习智能基础上进行的模型化测试,这里面需要大量的数据,很多规律只通过人是没有办法总结出来的,需要从数据里面提炼出来才行。


我推荐给大家一本书《终极算法》,这本书系统性地描绘了五种主要的人工智能方面,其中包括符号演绎、遗传算法等,这都是现在最常用的。每一种算法其实都有非常特殊的特点,人工智能为什么比较难?主要原因是每一种算法适应性不一样,比如说遗传算法适应去做物流的优化,它最主要是对最大化优化的分析,次优或者最优化的分析,而神经网络是大量数据进行迭代反馈的过程。所以神经网络迄今为止最有效的功能是图象识别和语义识别,这两种功能使用得最好。


关于人工智能的应用,我们分为三个层次,第一个是基础层,然后是技术层,然后是应用层。基础层包括硬件够不够快,算法够不够模块化。主要指的基础硬件方面,物理和数学层面。这两年非常火的,比如说刚获得投资的深鉴科技、地平线等等,这些实际上都指的是技术基础的硬件层。我们在不断地由于算法的推动而去改变硬件的模式,原来用CPU现在用GPU,各种各样的形式都是为了能够让算法计算的更快,所以硬件在不断地被算法倒推往前走。


我们还在寻求更快的云端计算,像量子技术,还有信息的传送包括压缩和解压,以及开源的算法模块。中国这两年的优势越来越明显,随着华为这一批企业的成长,带动了基础层不断地变强,这里面有非常多的机遇。



中国这两年发展最火的就是技术层面,即算法模块层面,这里面包括各种各样的感知模块,比如说视觉识别、语音识别、语义识别,这里面咱们所熟知公司的像思必驰、科大讯飞。随着语音识别继续往下,NOP就是一个非常重要的模块。我认为现在阻挡机器人发展最重要的模块就是NOP,什么时候NOP成熟了什么时候机器人就会迅速崛起,NOP就是自然语义识别。


技术层模块成为机器人成熟的基础条件。10年前我看过一个研究机器人的公司,他的特点是由一个团队自己闭门造车,每一个模块都是自己做的,而今年我再去看这家公司的时候,有一个很重要的变化就是每一个模块都由外部的公司外包了,说明研究机器人的公司越来越变得商业化,所有的公司做了底层的基础搭建之后马上就要商业化了,能够商业化的时间还有多长我现在没有办法断定,但是我知道这是非常重要的,这方面突破了以后上面的应用层就可以盘活。


对于应用层行业的普遍理解有一个误区,大家都觉得应用层的发展非常快,但是我认为现在还差一定的火候,很多东西还不成熟,应用层依赖于基础层和技术层,这两层还在不断地迭代,什么时候这两层完全成熟,应用层才会实现大的爆发。这在历史上已经出现过很多次了,大家都觉得有一个东西马上就要来了,但是这个东西还有多远是由底层机构决定的。


我们现在所关注比较多的就是技术层、基础层和To B的应用层,这些都是我们认为会有发展的行业,直接会产生经济效益,像量化金融、量化物流这些会直接产生经济效益。



为什么应用层还缺一点火候,我拿智能驾驶做一个比喻。

讲这个之前先把智能分成三块,叫弱智能、强智能和超智能。弱智能就是赋予智能,强智能就是迭代的智能,超智能就是迭代不出来的或者更高阶复杂的感性化智能。


对于智能驾驶来讲,智能驾驶分六个等级,想实现这个是非常非常困难的。智能驾驶来讲实际上分析的已经不单纯是交通问题,因为中国的交通问题非常非常复杂,应该分析很多方面的问题。我举一个有点搞笑的例子大家就能理解,有一个国外的交通学家到中国来,研究中国的交通问题,来的时候宣称在中国用一年时间就能把交通问题解决掉,结果他用了三年时间也没解决,回国之前他说中国的交通状况掺杂着很多社会问题,实在无法解决。


中国无论像北京、上海、杭州这些城市,不单单存在交通问题,还伴随着社会问题和人性问题,对于智能驾驶来讲是非常复杂的模块化的技术,除非把社会化和人性化的东西都模块化了,然后再去做智能驾驶才能真正实现。


通过智能驾驶也可以总结一个结论,主特征值越明确的,越单一的东西越好做人工智能,而场景看起来非常复杂的,这些方向短期内都不适合用人工智能来实现。


5、创业者的两条路径

最后再讲一讲,关于所有的技术行业发展进程。


任何技术行业来讲都有这么一个进程,最开始是一个技术萌芽期,然后进入摸索成长期,摸索成长就是指技术已经基本成熟了,我该怎么用,再下一个时段是上升红利期,比如2010年是最典型的上升红利期,像携程去哪儿、美团点评所有的公司都是在那个时代出现的。


到了2010-2015年是互联网产业的升级期,这个阶段把互联网想尽各种办法渗透到各个行业去做产业升级,发现有一些行业不适合互联网化。进入到2015年就进入到增长泡沫期,然后进入衰退期,最后这个互联网会变成一个工具。


历史上很多技术完成了这个过程,也有技术目前还没有完成过程,像PC和手机早就完成了,互联网才刚刚进行,对于很多新的东西,我们要抓取上升红利期的这一波机会。


我们认为目前来讲,AI基本上脱离了技术研发期,马上要进入上升红利期。这里面有一点对创业者非常重要:两种创业模式。


一种创业模式是如果你没有技术而你有资源和政策,应该是做上一个循环。因为在上一个循环的下坡过程中,比拼的已经不是技术和产品,比拼的是资源和政策。如果有整合资源的能力,那你就应该做互联网行业,有一些人还在拿互联网技术在想创新的商业模式,这很有可能会失败,因为整个互联网红利已经过去了。


如果你要想做创新,做技术,那你就应该走下一个新的时代,比拼的是技术和产品,这个是两种不同模式的创业。


我们的历史都是一遍一遍被各种各样的技术成长推动的,为什么2016年形成了资本寒冬?主要的原因是互联网下行,人工智能上行,处在交叉点上,2016年属于切换赛道的过程,而在2017年有一个新的变化,由于电子商务所搜集大量的数据基本成熟之后,这个时候人工智能已经可以开始发挥作用,所以我们在对于下一个浪潮已经开始布局了。


整个历史就是这样,从机械一体到机电一体化、硅机电一体化,指的都是一个一个浪潮往前推动的过程。我们现在就处在硅机电的后半段和碳硅一体化的前半段,最重要的是能够变得更加智能高效化。新生的科学研发过程很缓慢,产品也很便宜,这是新生的科学,真正的技术一定是降低成本和降低能获的过程。


今天就给大家分享这么多,谢谢大家。


文章来源:搜狐




星瀚资本

星瀚资本汇集全行业优质资源,是一家专注价值投资、创新理念、产业结合的专业风险投资机构。我们重点关注跨界融合和颠覆性创新的机遇,重点投资:产业升级、科技应用以及消费文娱等领域的中早期项目;我们结合广泛资源网络,打造投资企业产业链闭环;我们注重企业和团队的内在价值与创新能力以及长期发展潜力,以获取长期稳定回报为目标,投资有实质性创新和真正生产价值的企业。

发表
26906人 签到看排名