04微电叶晓敏:大数据祛魅,业务沟通成就更好的数据产品

2018-05-31|校友走访

敏:大数据祛魅,业务沟通成就更好的数据

复旦校友桥者:钟凯 东方

嘉宾简介:叶晓敏(复旦大学信息学院微电子学系04级校友)
阿里巴巴数据分析专家。毕业后从事大数据行业多年,曾先后供职于Opera Solutions、LinkedIn中国、小红书等国内外知名公司。现就职于阿里巴巴集团,在盒马担任数据分析专家,致力于通过数据为企业增长及业务发展提供支持。


记者:如今学数据相关的专业越来越火,首先想问的就是学术包括有机器学习,数据挖掘和数据科学,也有更细一点商业数据分析或是生物统计。学长您会觉得专业的选择上是偏向基础还是偏向应用比较好呢?

嘉宾:数据分析行业其实对专业性没有限制,因为就我个人的观察来说,现在做数据分析的大多数的专业可能来自于计算机、经济、电子工程,还有像物理、数学都有;而且不仅是理科,文科也可以做数据分析。数据分析其实是一个比较大的概念,数据分析其实它还可以划成很多细分的领域,比如说有偏商业分析一点的,有和建模相关的,就是用一些统计模型或者现在比较火的机器学习模型把它去做建模。其实数据分析整个行业就是用技术的手段去解决商业的问题,他其实考察的有两个方面的能力:第一方面就是你的技术能力,能够从庞大的数据当中找到你要的数据,能够来解决你商业问题的数据;还有一个是相当重要的就是商业分析的能力,就是你要知道你要解决的是一个什么样的商业问题,然后才能知道要去找对应什么样的数据来解决它。所以到底需要选什么样的专业或者学什么样的技能我觉得基本上专业不限,技能相对来说更加重要一些。

记者:如今数据专业感觉比之前要火很多,学长认为这当中有没有泡沫,什么样的人会更适合做这个。

嘉宾:泡沫是肯定有的,现在所谓的大数据或者说数据挖掘相对来说比较火一点,但是其实能够做到好的或者说做的有深度的其实并不多,怎么样叫有深度,我觉得也是按照我刚刚说的两个方向去走,其一是你要能够深刻地理解商业问题,你要知道我要去解决一个什么样的问题,他对于业务上有什么样的价值。其二就是我能够达到或者说我能够去找到我想要的数据去解决它,这两者对于听上去比较直观,在实际的工作当中有各种不同的层次:做的比较浅的就是现在外界比较火的就是各个公司都在招的所谓的数据分析师,他们可能做的事情相对来说比较基础,就是做一些报表;还有一种就是拿到什么数据就看什么数据,特别是在传统行业当中会比较多,可能一些外包的公司已经给我开发好了一系列报表,每天看那些,但是其实没有办法去更加深入地去探索数据背后的一些问题。

而现在大数据这个行业比较火的原因是互联网公司蓬勃发展,互联网就有一个特点就是他收集数据和处理数据是与生俱来的,而且数据量非常大,所以说在这种情况下催生了在互联网公司数据分析和数据挖掘的职位。他们可以从很大的数据当中去聚合去挖掘很多细小的点去找到很多的细节,同时他们的迭代速度也非常快,就是可以在每个版本发布的时候就去新增一些数据收集的功能,新进来的数据能够立马反映到结果上。相对于传统公司它的速度更加快,同时能够自己就某一类的问题找到数据当中隐含的结果,那这样的话他看问题也会更深入,这个就是目前我觉得是一个如果你要说你是一个数据挖掘专家或者说数据分析专家所必备的一个条件。同时其实即使做到这样还是会有不同层次的:比如说有一些比较基础的数据分析师,他能够做到从就某一类的业务找到某一个具体的答案来解决,那他可能是一个一个问题这样由点去解决的,相对来说能够串成一条线相对来说已经是比较资深的了;再往上一步就是把线连成面,就是说我要能够宏观地从公司整体以及公司所在的这个行业,以及整个商业的环境来透析我所要做的事情。比如说我们所在的一个公司是做一个电商或者新零售,那整个新零售行业现在面临的挑战是什么,能够拆解到我家公司面临的挑战是什么,同时再拆解到我这条业务线在这整个环境里面所在的位置是什么;我要怎么样去解决这个问题,我解决完这个问题之后我怎么样把我的解决方案去推广到更大的范围内去,所以这个就是一个更加去思考这样一个问题,所以基本上我对一个比较资深的或者成熟的分析师应该是这样理解的。

记者:刚刚说的是商业应用,您之前也提到有一部分是技术相关的,这一领域实际上您觉得在算法以及数理能力上的要求有多深?最近Kaggle、天池这样的比赛这种很火,甚至会出现过度拟合的迹象,这种情况学长怎么看?

嘉宾:我觉得是这样的在竞赛和实际工作当中运用的方法肯定是不一样的。像阿里办的天池之类的竞赛,其实是考验参赛者对于数据的处理能力以及算法的深度,能够去运用各种各样的模型去得到一个非常优的答案;但是实际你在具体的工作当中发现其实大家用的算法并没有那么高级,用的往往是非常成熟的像逻辑回归、决策树、随机森林这样的一些比较经典的模型,为什么会有这种情况,因为对于一些大公司而言,他们其实对于你的产出的解释性和可控度、稳定性要求是非常高的。你可能在参加比赛的时候运用了若干种模型结合在一起得到一个非常好的效果,但是它的透明度以及可控制性、稳定性是不知道的,在一些相应的场景来说公司是不敢用的,因为万一出现了一些bug或者有一些你目前没有考虑到的问题,例如影响非常大量的用户,这个时候就会造成很大的问题。所以会宁愿用一些性能没有那么最优化的模型来上线,那这样的话我对这个模型的可控度是非常高的。从面试的角度来说,只要基本功扎实了掌握了核心的模型,那学什么都会是非常快的,同时你做的这些东西稳定性也是有保障的。

记者:打个比方那么在未来这些比较基础的算法会不会迭代成更为新兴的算法。

嘉宾:是会有的,现在像GBDT和神经网络这些都有取代以前的像随机森林等这样模型的可能;不过我看到绝大部分用的还都是比较传统的模型去做的。

记者:可不可以介绍一下您平时作为数据科学家工作中典型的一天呢?

嘉宾:其实我的一天可能不那么典型:早上九点半左右到公司,看一下邮件盘点一下接下去要做哪些事情,并且稍稍地回顾一下,然后就开始投入工作。开会中主要做的事情是在跟对接的业务团队去交流,看我他们想要继续深挖的问题是什么,和其他部门沟通完需要和团队内部再沟通。沟通完之后基本白天就过去了。吃完晚饭就开始干活,干到九、十点钟,把一天手里的工作总结一下,基本上这么一天就过去了。做的事情其实除了对接开会之外除了开会之外具体做的事情可能分几类,第一类就是总结类的,就是开会沟通的内容落地成邮件或者PPT,把讨论的结果给写下来,然后能够发布执行的任务;第二类是执行类的工作,比如说有些业务需要动手写代码做报表,看各种各样维度的数据来获得结果,做一些自动化的表格,完成之后交付给业务方。沟通在工作当中的占比可能相对来说职业起步阶段会少一点,百分之二三十,因为绝大部分沟通是主管上级做的;但是当你慢慢往上走的情况下你会发现沟通占你工作的50%。

记者:沟通比如说像前面说的决策模型,跑出来的结果可能对细分出来的结果非常多,但是他其实在业务那边很难执行只能把几条落地,遇到这种问题的时候应该怎么办?

嘉宾:就是当你做出一个你自认为很好的结果,比如说你给出了十七八种解决方案,但是业务方就是说我只能做三四种,这个时候就是要考验你的决策能力:哪三条的优先级是最高的,然后告诉他哪三个对他的业务产生的影响最大,他是否认可,如果他认可就去执行。

记者:现在数据分析行业除了互联网公司,还有哪些公司在做?

嘉宾:主要是金融类和市场研究类。金融类的公司他们比较多的用在风险管理上,我要做风险管理,我怎么样保证我的每一笔投资或者我每一笔借款他的风险是最低的,P2P借款也有一个很大的一个数据的团队在后面去帮他们做支撑。还有市场研究类的,他们可能是通过一些比较传统的方式,比如说做问卷,他们的这种特点就是数据量相对来说比较小一点,也会在各种更加数据量大的方向去转型。

记者:最近所谓的大数据杀熟,您觉得这是企业决策优化、精准化还是对消费者剩余的榨取呢?

嘉宾:我觉这两种思考方式都有可能。比如对于打车软件而言,一种解释是对于老用户的估价更准确,从五角场到人民广场就是50元;对于新用户来说我为了提高转化,给一个相对来说偏低一点的价格,比如45元,但其实新老用户走的路线、时间可能是一样的,只是展示的定价不太一样;还有一种就是可能就是故意的,我知道你老用户年薪很高,你对于50元、45元感知是一样的,新用户相对来说我为了获取他的使用给了45块,中间差了5块钱可能就叫我的获客成本,等于是花了5块钱就把一个新客拿到了。具体选用哪种方式思考,就看这家公司的价值观到底是以盈利为主还是以服务用户为主。

记者:那您有没有特别推荐阅读的相关书记或者可以学习的数据科学家呢?

嘉宾:我觉得最好的老师还是实践,就是你如果能够进入一家公司一家比较好的公司,能够实际上手去做,能够解决业务问题,在实践当中去学习我觉得那肯定是最好的。

我觉得我个人认为目前国内在普及上做得比较好的数据科学家有一位叫做张溪梦。她以前是eBay美国总部的数据分析团队商务智能的负责人,后来去了领英之后把他们的数据团队给带起来了。之后她回国创业,创立了一家公司叫做GrowingIO,这是一家为企业提供数据分析解决方案的一家公司,它在传播数据分析的一些基础知识以及方法论都是做的很好的。主要是通过一些案例去学习互联网公司当中会遇到哪些常见的问题以及怎么样运用你的工具去处理它,这些处理结果有什么样的商业的就是业务的落地的方案,以及最后体现的效果,我觉得能够把这个闭环串起来其实对于大家的成长是非常有帮助的。




复旦校友桥FACE(Fudan Alumni Communication and Empowerment)
Slogan:聚合象牙塔内外的复旦人,建立属于我们的复旦部落。

成立初衷:本组织成立之初是响应校长的号召,校长是想建立校外校友和在校同学的更紧密的联系,不但让校友感受到关怀,也让在校生得到关于人生、理想、思维各方面的照拂。我们会去台湾采访另一个话语体系下的复旦人,我们会走到校友家中采访他们的复旦故事。我们渴望校内的复旦人更了解离开象牙塔的复旦人,从而对将来的人生和现在的思考带来更多的养料。

业务范畴:运营复旦校友桥公众号,提供校友专访推送,向复旦校内人提供业界学界一手资料和先进思想;联合学生组织和校友会,为学生活动邀请重量级嘉宾牵线搭桥,大限度地降低邀请大佬的门槛;高质量的人物访谈或讨论的内容生产是根本,牵线搭桥便利复旦学生是依托。

关键词:复旦人 | 资源 | 关注 | 洞见 | 温度

如果您有兴趣加入我们,请联系15201722630@163.com


最新文章