- 前言:大数据圈子里,数据挖掘工程师这个岗位有它的特殊性,宁缺毋滥。当然,想跨入这个门槛的人也很多,碰壁的更不计其数。冬天来了,没有鸡汤暖心并不是我吝啬,只是,职场就是这样。
写这篇文章的初衷,主要有以下三点:
- 有打算,在《以什么姿势进入数据挖掘会少走弯路》的系列里,需要有这样的章节。
- 为了朋友,身边好几个读研的老同学,以前的同事,甚至是高中的挚友,都或多或少朝着这个方向在准备着。
- 写给那些在数据圈,却又没真正理解数据挖掘的面试官所看,竟是乱捣蛋,毁人不倦。
如何去写好这种都快被大众嚼碎的文章呢?有挑战性,但是我愿意去写。一方面,以往文章,只授之鱼,并没授之以渔,一堆该看什么书,掌握什么技能,形有了,而神没了。一方面,我想以自己的切身经历,让大家能够感受到作为面试官和应聘者看问题的角度。
为了不同而去不同,我不倡导。而将隐晦的事,简单明了说清楚,是我一直朝着的方向。
这篇文章会从下面三个点去说清楚一件事——公司需要什么样的数据挖掘工程师?
- 作为面试官的我,都遇到过那些应聘数据挖掘的人?
- 跳槽后,成为应聘者的我,都遇到过那些面试官?
- 现在带数据产品的我,倘若明年项目发展健康,急需扩招数据挖掘工程师,我期待遇到什么样的你?
第一篇章:我作为面试官的那些日子
当初的老东家,是一家在电商领域做技术服务的科技公司,属于创业型公司中的高富帅,发展很快,一年不到时间,员工人数突破200人,我是第80号员工。
而我所在的大数据部,主导核心是做数据产品,由于产品线比较多(这也为以后埋下了不小的坑!),况且数据挖掘是所有数据产品中的核心,这可必须要多招人。
那时候在做用户画像的精准推荐,仅仅整个用户体系和商品体系的标签维度都和业务运营方讨论了一个多月,曾经有一段时间都没在自己公司,整天往甲方公司跑,和公司老板、高层技术和运营负责人一起过产品方案、需要哪些标签去更好对用户做精准营销?
整个面试的流程是这样的,我负责第一轮,如果我觉得靠谱,可以一起工作。基本老大的那关都是顺利的,至于人事那儿就是钱的问题了。
我很重视去招一起做数据挖掘的伙伴,当时我花了一天时间出了套面试题,一方面是为了深入了解应聘者的基础和态度,让面试更顺畅。一方面,严谨的初筛,能够节省我的时间,不去继续没有价值的面试。(切记:如果去面试,不管填资料、做题目,说是考察,实际是看态度,请各位用心对待。)
当时是从下面这四个方面去进行的考察:
- 对于常用的算法模型,知其然,晓其所以然。模型不在乎多,而在于熟练应用到业务中;
- 对于大数据生态圈,做数据挖掘也会实操的ETL流程,既会用,也要使用得正确;
- 对于行业的业务需要去了解,别遇到事就往论文里去找各种高大上的模型,多和高级运营人员去交流业务场景。
- 一定的代码能力,即使你不像Java工程师一样,多线程,高并发,JVM等等。但是杜绝纸上谈兵。
我记不清面试了多少个人了,不是量多,主要是事忙。归纳起来,有下面三类典型的应聘者:
- 有个好背景,留学归来、香港某大学博士生,数学专业的研究生等等。追随着大数据潮流,漫天要价,或者说学习能力强,愿意学习。但对大数据是什么?数据挖掘做什么?以及所面试行业的基本业务知识,都浑然不知!(这样的情况显然准备不够充分,我都会鼓励着好好回去多了解下,有的是机会。)
- 工作有许年头了,转型做数据挖掘,不管是自学、还是参加培训班,对数据挖掘有一定的了解。但是心里话,乱忽悠,也没有体现出对数据挖掘有多热爱,同样基本功不够扎实,都是需要从头开始学。最严重是,缺乏一颗从头学习的心,漫天要价!
- 特别遇到一个典型的,年纪35上下,背景也比较不错,曾经待过BAT,以及唯品会。做的数据挖掘的事,虽然谈不上高大上,但是的确是将数据挖掘将业务产品流程有融合。我觉得靠谱,毕竟还是我的长者,只可惜此人钟爱于开发一生,只愿意继续做开发,不想带数据产品,觉得自己不擅长,最终薪资也不匹配。
说心里话,综合起来说,从态度、热情、基本功以及潜力,我没有遇到满意的,这并不是我苛刻,是这个岗位现在变得有些混乱,鱼目混珠,很难遇到让你心动的人。所以我才说,真正有要求的公司,宁缺毋滥!一点不是吓唬人。
第二篇章:我作为应聘者的那些日子
由于个人发展,我选择了重新寻求新的工作机会。如果真要表明走的原因,我觉得很早以前老大对我的有句评价还较为合适。一次部门内部的洽谈会,他大意是这样:你个人色彩挺强烈,也有理想,倘若一个创业公司的发展与当初衷的理念背道而驰,与你的想法差距很大,你肯定待不下去。但如果你遇到相吻合的公司环境,你一定成长得特别快。
所以,我走了,成为了一名应聘者。我后期总共面试了15家公司,这其中的面试,遇到了一些有典型的面试官,也收获了一些感悟。
对于下一份工作,我当时对自己提了三点要求:
- 在公司层面上,寻找在电商、互联网金融和智能家居领域上发展势头好或有潜力的公司,而且公司对待业务与技术的重视度,差距不要太大。
- 在部门层面上,整个部门所做的事,采用的技术,不说时刻追随者社区发展,但至少不要被拉很大差距。而且负责人能清楚意识到数据产品在整个大数据角色性。
- 在个人层面上,利用我所长,能够尽自己最大的能耐,有这样一个机会创造出自己价值。
现在看来,那时候的要求是有一定的门槛,不过幸运的是,我觉得自己目前就处于这样的一个工作环境中。
谈起那时候的15场面试,大体可以分上半场和下半场。在上半场时,自我承认个性有些张扬,也因此错过了一些看似不错的机会,就像去相亲一样,揣着自己的各种要求,一味的拿条条框框去做判断和筛选,忽视了两个人之间洽谈的感受。而在下半场以后,我懂得去倾听,去感受整个公司、部门的文化,以及在做的事,打算做的事。多了些包容性,多了些面试交谈过程的中思维碰撞和磨合,从而找到未来一起共事的可能性。
如果说是归类所有面试过的公司,有下面四个典型的特点:
- 基础建设薄弱(占比50%):一些想投身于大数据圈子的应聘者认为现在大数据这么火,做大数据的公司会挺多的吧?然而并不是这样,人人谈大数据,但真正做大数据的公司是挺少的,优秀者更是少之又少。毕竟养一个大数据部门是需要很多运营成本的,服务器上,高薪技术人员上,更让高层担心的是,这么多付出,能有回报?
当时我周三下午办完离职手续,在周四早上就有面试邀请,从早上9点开始,顺利进行了三轮,中午就收到offer了,让我下周一入职报道。
这是一家国内知名,但是名声不太好的上市互联网公司,做的业务面很多,在广告投放上尝到了点数据挖掘的甜头,于是乎想扩招数据挖掘工程师。但也许你没想到,他们并没有大数据基础性的建设,仅仅在用PHP写一些单机的算法。
同样类型的公司还遇到过几家。对于数据挖掘这块的新人而言,我不提倡去这样的公司,一方面环境影响了你的格局,你未来的发展会受限。一方面你的确需要有人去引导着,正确的学习,不至于闭门造车。
- 创业型大数据公司(占比20%):现在的环境,的确有不少创业将数据与商业融合的公司,我当初遇到了4家,智能家居做电视、互联网金融做投资、智能软件和精准搜索。这些公司创始人背景都与大数据有一定的联系,而且招数据挖掘这块也挺慎重的,对于面试者是否真才实干?还是忽悠?别人一眼就能看出来。不过这类型的公司,都有一个很要命的通病,缺乏数据,这很致命!
真考虑去这类型公司的面试者,一方面得准备充分,有真才实干。一方面也需要多考虑,因为未来的日子里,你会发现自己找不到数据来做模型,如果公司一直解决不了这事,你最终会没有事做,整天就只有学习,成长起来也慢。
当初去面试这几家公司。做智能软件和智能家居这两家,考虑到离我住的地方挺近,所以当时优先考虑了。对于去面智能软件这家时,我觉得自己过于张扬了,同时技术总监也不够惜才,也就没有然后。
那天是我找工作的第二天,也就是周五。上午到下午2点期间已经面了一个公司,原本约好下午3点去这家公司面试,不料和HR沟通有误,是我错怪了HR,接受面试邀请的邮箱留错了,我也就没看到公司具体地址,只知道大概。
结果坐车去面试过程中,还多坐过了两个站。毕竟已经收到offer了,当时就松懈了,索性给HR反馈了情况,坐着车回家了。
我当时是下午5点左右到的家,进屋没多久,那边HR电话联系过来,让我再去面试,他们周五加班等着我。我是真不想去,于是就直接说明情况,自己快入职了,而且已经挺累了,最重要我还要求挺多的,让她们按时下班吧。我让HR先和他们技术负责人表明清楚,再联系我吧。
10分钟不到,电话回复过来,坚持让我过去一趟,只要谈得满意,一切OK。我当时就有点来劲了,算是一种认可,我必须得去一趟。整理一切,出门坐车,不到20分钟就到他们公司楼下了。
当晚面试从6点半开始的,一直持续到8点半左右,总共面试了三轮,部门负责人,技术总监,最后HR,到后面我整个人基本饿晕(这么个公司有加班餐,都不为面试者提供一份盒饭,差评!)。其实整个面试表现都还算不错,毕竟还都谈了薪资福利了。最后让我回去等通知,我还提醒了,最好周六,因为我也需要考虑一天。
结果意料之外,却在意料之中,我并没有被录取。我当时感觉受尽委屈,不仅累着、饿着去面试,还一切顺利的面了两个多小时,正常的薪资都开始谈了,没有理由啊!
事后我曾单独联系了其中几个HR咨询,给我的反馈是这样的:公司对于这个岗位需求很大,来面试的人也很多,但是基本第一轮就被毙了。你的确是很优秀,面了最后一轮,专业上没问题。只是。。。觉得由于年轻过于张扬了,技术总监或许不喜欢这样的性格。
好吧,事后自己总结,的确上半场的一些面试,多了些张扬,少了些谦卑。也许是太想急于表现,弄巧成拙,但我保证做事是十足的认真负责。(其实由于这个点,到最后一轮弄坏了一些好事。至少有3家公司)
年轻不是借口,犯了错没什么,善于学习和打磨自己才是意义所在。希望,以后去面试的同学,谨记于此,面试看上去是能力的考核,实质上是人与人之间相处的学问,切有技无德。
- 中规中矩有一定规模的公司(20%):这些公司发展规模还是较为不错,在自己目前的业务主线上找到了竞争的优势。既然大环境趋势,而且有数据积累,自然而然必须去组建大数据团队了。其实这样的公司我还是比较提倡去试试,一方面,有多年的数据积累,有各个渠道的数据整合,这才是玩大数据的前提。一方面,这样的公司,公司老板有这样的发展方向,肯定会招纳贤才,甚至鼓励部门内部的良心竞争,寻找有能力的大数据人才,布局公司未来在大数据圈的战略发展。
在我面试的过程中,也遇到过几家这样的公司,包括自己目前所在的公司。如果去这样的公司去应聘,或者工作,创新思维很重要。创新能力,是这类公司最紧缺的,如何去从传统的业务线里去摸索出有价值的启发点,真真落地做出大数据产品去辅助运营,降低运营成本,增加公司利润。
我当初去面试现在这家公司,聊得挺开心,公司规模也足够大(原来总员工数1w+,目前由于业务调整,6k+的员工)。当时总共进行了四轮面试,部门负责人、整个研发部负责人、HR、CTO。各方面我觉得挺匹配的,也能感觉到对我的认可,面试结束的两个小时后就收到了offer。
如果说起为何如此顺利的原因,我总结了这三点,1.性格收敛,态度诚恳;2.数据挖掘这个岗位素养的长期培养,专业性,能够表现出来,让面试官被感染,而不是给人一种竟是忽悠的东西;3.创新思维,这正是他们所需要的,以至于不再考虑以后的面试,不到两个小时就给我发offer了。
我很欣赏认可我的人,我也不会辜负认可我的人,就像我工作一样,写文章一样,生活中与朋友相处一样。因为我有自信,所以我觉得你是个有眼光的人。
- 奇葩,比较做的公司(10%):这类公司外表光鲜亮人,给人福利满满的感觉,但是是一种慢性毒药,会让你逐渐失去战斗力,俗称养老型公司。如果你想在大数据圈有所建树,这类型的公司,我不提倡去应聘。
为什么说这样的公司奇葩呢?体制内的公司,各种条条框框,学历,背景,等等。正式面试都还没开始,电话面试结束后,就懵的告诉你,我们优先招研究生,要不等看看别人面试效果再做决定?
我遇到过一次,公司算是知名度还可以,福利也吹得还不错,我是内部推荐过去的。一次电话做了一个简单面试,我当时在坐车,一个女面试官电话call过来,简单聊了会就开始问所谓的专业性的问题。问着问着,坐车比较也吵杂,不太方便交流。而且聊到现在,都是在问hive相关的事,我刚开始还认真回答,到后面我都略过了,我一想,完了,这都哪跟哪。我直接表明,你问的,很早以前就做过了,比较初级,而且我投的是做数据挖掘方面,业务,用户画像这些,你换个问吧。结果给我的回复是,数据挖掘不就做这些事?你说的用户画像是什么?
无语了,一个公司的面试官,也算是这个公司部门技术的代表,这和社会脱节是挺严重的。我当时也并没有生气,也许别人认为我太菜了,还不是研究生,随便找个来面我。所以我最后说了,今天车上也不方便深入面试,你们确定个时间,我来公司当面进行交流吧。
结果呢,当然也没有结果了,后面得到的反馈是:我们面试流程里面,有两个研究生准备安排面试,要不你等等?看看效果再联系你,我们都是优先招研究生的。
其实说到这里,也并没有自卑。一方面,曾经数据建模获奖无数,包括全国一等奖,那时候大三上已经具备保研资格了。当然,后面决定工作后,也没关心这事,碰巧最后实习忙,挂了一科,失去了名额。一方面,我工作到现在,接触的人和做的工作,我知道自己能力。而且现在带产品,从无到有的调研、规划和开发,以及推动着比自己工作年限多得多的同事,甚至跨部门的其他同事。对于谈这个的公司、HR、甚至技术负责人,我觉得这些只是小孩子会想的事。
对于工作年限、学历以及背景,这些包装,我希望大家理性去看待,包括应聘者,不要有自卑感,也不需要有优越感,因为它们有利有弊,你慢慢就能体会到。而且日久见人心是最能说明白一切。如果你去应聘过程中碰到这样的公司,我希望你昂着头去换个方向找到更能体现你价值的平台。
第三篇章:如果招个DataMining Engineer,期待遇到这样的你
以前写的一篇文章《数据情怀,你曾经拥有过?》中提到过我目前在做的事,这里简单说下背景。目的还是在于表达应聘成为一名数据挖掘工程师,都有哪些要求?
现在做的数据产品是关于互联网金融行业p2p平台上,羊毛党反欺诈监控系统,主要有以下几点描述:
- 特殊性:羊毛党这个群体在电商、金融行业都有,它不同于黄牛党,目前在P2P理财投资平台上较为活跃,薅羊毛的事对于一个p2p平台来说,有利有弊,这个平衡点稍不注意,严重能导致一个公司的经营倒闭,甚至跑路。
- 痛点之处:整个羊毛党反欺诈监控系统的核心是解决两个痛点问题:精准和实时。发现羊毛党并不是问题的关键,辨别出羊毛党属于哪一种类别,也就是对羊毛党群体的细分才是核心。平台不反对个人,以及家庭、朋友之间的薅羊毛党行为。但是严重抵触恶意薅羊毛的团伙,靠这种行为养家糊口。
- 差异性:很多平台都想做,甚至正在做这方面的事。以及包括我们集团下另一个新成立的子公司。但是我们和别人的差异性在哪里?以及为什么我们集团新成立的子公司花了半年时间,却没能做成,最后无奈被面临解散,而我们已经上线了第一个阶段的版本,已经在快马加鞭做第二个阶段的开发呢?我总结起来,时代变了,以往那一套模式缺乏大数据思维,更多依靠黑名单已经不受用了。
- 技术亮点:目前整个羊毛党反欺诈监控系统包括六个引擎服务:全渠道用户关键行为数据收集与实时传送、利用模型自主学习的黑名单风险库、核心业务指标整合的规则引擎服务、实时在线学习的反欺诈模型、异常监控预警短信\邮件服务、反欺诈用户体系画像。未来还会融合APP产品流程,增加征信流程服务。
上述的大概描述是目前做完的事,以及正在做的事。考虑到快年底了,我也不可能说,别领年终奖了,咋们一起改变世界吧!多不切合实际,所以才是说来年。
还有三个月不到的时间,这段时间我们会逐渐完善整个系统的所有前后端功能,以及与业务产品流程的融合,努力把这款产品运营起来,等着你们。
可能你会问,这都做完了,还有啥事?还招什么人呢?并不是这样,大数据挖掘能做的事还有很多,以及能做的数据产品还有很多。
如果我又招人,这次期待遇到什么样的数据挖掘工程师呢?
- 初心:既然选择踏入大数据圈子里,从事数据挖掘的工作,首先最重要的是自己的初心,混日子我觉得没意思,天天盯着电脑,等着下班,颈椎也难受,心也难熬。(不信你去试试就能体会这话)
- 素养:具备基本的数据素养,数据挖掘相关的基本知识别丢了,一问三不知,全是大忽悠。你要有一颗认真负责的心,对待数据的真实性、准确率以及安全性。(操作数据谨慎,别懵删服务器上的表数据了,也要注意数据泄露。小细节平时忽视,关键时刻必掉坑)
- code能力:很多人抱怨,经常去面试会让写排序算法、二叉树等等,以及提笔写代码,我并不要求这样。而我也同情你们,遇到了一个从Java开发转过来做数据开发的工程师,更可耻的是,他们提的要求自己也并不能完成。错就错在遇到临时工,隔行隔山。考察数据挖掘工程师的代码能力也不是这样的,至少我认为你可以展示曾经写过的代码,从代码风格,注释说明、以及重构代码的习惯上已经足够了。
- 业务与技术的平衡:很多做数据挖掘的人,一遇到需求,满脑子都是模型,应该多查点文献,用更高大上的模型让领导觉得特牛,我保证你会吃亏的。这是最致命的,一个对业务忽视的数据挖掘工程师,绝对做不出一个好模型。而我希望你遇到需求,多去了解业务,多和高级运营人员沟通,他们才是你正确的方向。
- 自我价值的认知:数据挖掘这个岗位,需要有一定的综合能力。它也是最容易将数据的价值变现的一个岗位,更是未来做好一个数据产品经理的必经之路。因此,对于每一个从事数据挖掘工作的人来说,请你充满使命感,有能将你自己价值发挥最大化的决心。
总体来,为了说清楚一件事——公司需要什么样的数据挖掘工程师?我以自身的体会去告诉你这些:
- 一方面概括以往所遇到的面试者的特点,希望引以为戒。
- 一方面作为应聘者,我遇到那种类型的公司,面试过程中掉的坑,以及对自己的客观定位。
- 一方面,重新看待招聘数据挖掘工程师这个岗位,我期待你能在哪些点上做好充足的准备。
别的一切不说,祝各位好运。