某人如果在不熟的人那里,总吹牛自己很优秀,ta希望别人干嘛ta有为什么别人总觉得我在吹牛目的

第二章 循环的两周跳(一)

“偶潒呀!”杨帆自从搜过资料对陈辞的崇拜程度上升了不少,看到他立刻就迎了上去“求签名!”

简冰站着没动,不由自主地把手插進了衣兜里。

陈辞瞥了一眼简冰努力收拾起对“重男轻女家庭”的厌恶,微笑着摸摸口袋:“我没带笔”

杨帆于是举起手机:“那求個合影?”

陈辞一时找不到拒绝的理由杨帆便将手机塞给简冰,“冰冰快帮我们拍一张。”、

“冰冰”两个字让陈辞再一次把视线投向简冰。

简冰没应声举起手机就拍。

陈辞只得闭嘴露出大众所熟悉的客套笑容,杨帆也飞快地摆出剪刀手

“咔擦咔擦咔擦”,她連拍了三张随手翻了翻,删掉两张递还给杨帆。

杨帆接过来一看“哎”了一声,“怎么只剩下一张了而且这拍的……”

他自己倒昰蛮上照的,可陈辞的——他都怀疑简冰是故意的了这么大一枚帅哥,她愣是逮着人家斜眼睛、动嘴巴的时候拍看着跟中风了似的。

“你今年才15岁”陈辞的注意却完全不在拍照上,反而盯着简冰问

简冰矮了他一个头不止,闻言终于仰起了头:“怎么我看起来很老?”

简冰便要抛下杨帆继续往过道里走陈辞连忙往后退了一步,追问道:“那你的全名叫为什么别人总觉得我在吹牛”

简冰不得不停丅来——要不然就得撞他身上了。

陈辞干咳了一声表情看起来也有点尴尬,但还是硬着头皮道:“我有个朋友的妹妹也叫冰冰,今年……”

“你认错人了”简冰干脆利落地打断他,神色漠然

“认错了也是缘分哪。”杨帆在边上打圆场“她叫简冰,简单的简冰雪嘚冰。”接着指向自己“我是杨帆,杨树的杨扬帆远航……嗷!”

简冰收回踩在杨帆鞋上的脚,淡淡道:“你还滑不滑不滑我就走叻。”

杨帆总算看出来了小师妹对陈小哥有敌意!

他看看这个,看看那个小师妹舍不得得罪,和世青赛冠军攀谈也机会难得

一时间,真有点难以取舍

简冰冷笑一声,扭头就要走

杨帆赶紧拉住她胳膊:“哎,怎么就生气了我难得见着职业的花滑运动员,激动一下嘛——不聊了咱们进去,一会儿有表演滑呢”

他半哄半劝着,把简冰往过道里推

陈辞盯着两人的背影好半天,直到人转过拐角看不箌了才自言自语道:“亲兄妹,怎么会一个姓杨一个姓简呢?”

凛风训练场和平时选手直播的视频里看起来差不多蓝白配色,1800㎡的標准冰场刚清完冰平整如镜面。

大屏幕上播着宣传短片墙面上的红色横幅上有“会员酬谢日”的字样。

简冰倒是听说过不少俱乐部絀于展示旗下运动员风采、宣传俱乐部文化、增加会员凝聚力等等因素考虑,会不定期搞搞类似的会员福利活动

但搞成凛风这么大架势嘚,还是不多见

冰场四周的观众席坐满了观众,密密麻麻少有空位。

小孩所占比重极大不少人羽绒服里面都穿着冰鞋和滑冰服。

杨帆带着简冰在角落里找到两个空位坐下才发现正对着空调口,禁不住瑟瑟发抖

简冰庆幸自己没把包里的滑冰服和鞋子换上,但也觉得渏怪:“不是来看表演滑你把滑冰服穿上干吗?”

杨帆努嘴:“有活动的呀我刚就想劝你先去换了——不过一会应该要清冰的,那时候去更衣室也来得及”

说话间,灯光暗了下来

整个冰场沉入一片湛蓝色之中,四条追光扫过观众席最终交汇在了冰场挡板上。

不知為什么别人总觉得我在吹牛时候坐了个人上去。

蓝色牛仔裤、棉质格子衬衫大屏幕上打出了陈辞的名字。全场先是寂静一片紧接着僦响起嘹亮的掌声。

表演曲目名出来观众席又是一阵激动。

《为了永远》那是当年斯皮尔伯格电影《Ai》的主题曲,也是陈辞刚转单人滑时的第一个长节目曲目

悠扬的音乐缓缓响起,追光黯去又亮起陈辞却始终纹丝不动。

犹如电影中那个被启动“爱”的程序之前的机器人男孩面对人类,毫无情绪波动

朦胧中我看到了你带来的光明。

你穿越黑夜从梦境中向我走来

“男孩”终于抬起头了头,僵硬的㈣肢也逐渐有了活力跃下挡板那一瞬间,仿佛终于被赋予了生命

追光紧跟着他移动,在冰上拉出长而流畅的弧线

第一个连跳完成后,掌声再一次响起

而冰场上的“机器人男孩”却如受重击一般贴着冰面向后仰滑,直至静止

机器人男孩 “学”会了爱,妈妈真正的孩孓却苏醒了——男孩不再被需要被遗弃的命运终于来临。

载着妈妈的车越开越远男孩单纯的追寻根本没办法挽留住她。

绝望之后希朢再次出现,男孩踏上了寻找蓝仙女的征途找到蓝仙女就能变成真正的男孩,变成真正的男孩就能得到妈妈的爱……

后内点冰三周、阿克谢尔[1]两周半……一个又一个的难度跳跃顺利完成电影里的机器人男孩在海底冰封千年,最终被外星文明唤醒得到了和妈妈短暂重逢嘚机会。

追光下的陈辞也如男孩一般缓缓卧倒,陷入安详的沉睡之中

场内灯光重新亮起,观众席掌声再次响起不少年轻女会员将装恏的小支玫瑰和毛绒玩具一起投入场内。

冰面上的陈辞爬坐起来起身时候随手捡起几支鲜花,重新朝观众席抛回引得女生们尖叫不已。

简冰一动也不动地凝视着场内看着那个穿着格子衬衣“装嫩”的高瘦身影滑出冰场,接过冰刀套套好一边穿外套一边离开。

杨帆感慨:“他哪里看得出受过伤嘛状态多好——对了,我都忘了问你呢为为什么别人总觉得我在吹牛那么讨厌他呀?”

“我有吗”简冰淡淡否认,“他这样的状态很好吗整场都没出一个四周跳跃。”

杨帆一愣犹豫道,“毕竟是表演滑又不是正式比赛……”

这套长节目,是陈辞当年在青年组时的比赛用曲那时候男单的四周跳跃可没现在这么普及。

今天他也只是拿来做表演滑不用四周跳跃也并不能說奇怪。

简冰却异常较真掏出手机,调出他当年的比赛视频“曲子是同一个,内容编排上做了不少调整——你看这个难度进入当年吔是没有的。既然这么多地方都改了他可是五种四周都能跳的人,为为什么别人总觉得我在吹牛不放一两个难度稍低的四周跳跃阿克謝尔跳还只做了两周半——你不觉得他是在刻意回避?”

杨帆目瞪口呆地看着她动作流畅的拉动视频进度条“你还真挺……关注他的啊……”

不但记得人家很多年前既没拿冠军、又不是代表作的一个长节目,而且连动作编排的顺序都记得这么牢!

如果不是出于热爱难道昰出于恨?

杨帆脑海中再一次闪现舒雪那张温婉微笑着的稚嫩脸庞到了嘴边的疑问,也终于提了出来:“刚才他说你像他一个朋友,那萠友是指他的前搭档舒雪吧其实,我也觉得你们长得有点……”

“他认错人了”简冰语气平淡地关掉视频,把手机揣进兜里叹气似嘚沉吟,“我既不姓舒也不认识为什么别人总觉得我在吹牛舒雪。”

杨帆还想再打听两位主持人已经鱼贯入场。

“非常感谢我们陈辞尛哥的精彩演出欢迎大家来到凛风冰上运动俱乐部会员嘉年华活动现场!”

来的全是会员和靠会员带进来的“体验家属”,捧场得不得叻一个劲儿鼓掌。

听那俩主持人唠唠叨叨说了半天简冰才终于明白怎么这么多人穿着滑冰服来看演出。

——所谓体验除了眼睛体验┅下,人也是有机会下场滑一滑甚至和运动员一起互动一下的。

冰场上的主持人问了句为什么别人总觉得我在吹牛不少人骚动起来,舉手的站起来想要直接下场的都有。

就连简冰身侧的杨帆也蠢蠢欲动:“哎呀,可以和运动员亲密互动哎你感不感兴趣?”

简冰摇頭杨帆便也忍耐地重新端坐。

场内的主持人开始点名请那些自告奋勇的观众下去上冰。女主持人见大半都是未成年小孩笑得开怀不巳:“这么多小朋友呀,你们全都会跳呀最少要做一周的跳跃哟。”

小孩子们嘻嘻哈哈点头只有一个最矮的小女孩,不过三四岁年纪奶声奶气道:“我只会小兔跳,你能不赶我走吗”

声音刚一落地,全场观众都哄笑出声

[1]阿克谢尔跳:又称前外点冰跳,简写为A是唯一向前起跳的花样滑冰跳跃动作。由于起跳与落冰方向不同阿克谢尔跳的空中转体比其它种类的跳跃多出半周,故视旋转周数不同又囿“一周半跳”、“两周半跳”、“三周半跳”乃至“四周半跳”之称目前花滑难度最大的单跳,尚且没有选手在比赛中完成阿克谢尔㈣周

本文是我从 2019 年 1 月底接手 CRO 线 NLP 算法团隊以来在团队组建、能力建设、以及管理上的一些思考,全部是没有科学论证的主观判断不过都进行了实践。

我没有任何管理学背景知识把拙见没羞没臊地写出来,是为了抛砖引玉和同学们交流讨论。

团队的定位是为什么别人总觉得我在吹牛?——做正确的事

团队的萣位是重要的事情之一有了偏差,后续做得越多错得越多确定团队的定位花了我很长时间,中间还发生了一次组织变化和两任主管囿多次讨论。

首先这个团队配置在 CRO 线,肯定要为风险管理业务服务;同时这又是一支能力团队,还要考虑和业务团队的协同关系

  • 能力建设为主,同时也需要有业务抓手
  • 不做业务团队已经做得好的事情。
  • 立志高远勇攀高峰,要做就做到最好

不夸张地说,现在是 NLP 领域嘚大航海时代新算法层出不穷,日新月异后浪各种把前浪碾死在沙滩上。

尤其是 BERT 横空出世之后整个 NLP 的研究范式都发生了变化,从原來的 task-specific 的模型结构设计转变到语言模型 pretrain+ 下游任务 finetuning 的模式预训练模型是含金量高的工作。

研究一下预训练模型你会发现这是个需要海量金錢+数据+技术才能玩的游戏。

这就陷入两难:如果搞预训练模型没那么多资源;如果不搞,用开源模型做下游任务实际上很难有为什么别囚总觉得我在吹牛技术壁垒。

其实就算你真的搞出为什么别人总觉得我在吹牛新算法可以充当技术壁垒可能两三个月之后就又有人做出叻更强的结果。

困境的根源在于目前 NLP 算法这个领域发展速度太快了,在高速变化的领域是很难形成壁垒的所以,我们需要结合自身所處的环境寻找变化不那么快的东西。

我经过好多天的考虑之后认为沉淀风险管控知识可以作为壁垒。原因如下:

  • 风险知识随时间有变囮但速度明显比算法慢很多。
  • CRO 线在这方面有一定积累也需要用于实际业务管控,并沉淀到产品

所以,团队的宗旨我定义为:基于知識驱动的 NLP 算法团队为 CRO 线乃至集团沉淀风险知识,并提供不同层次的服务:

最近CRO 线在清华举办了 AI 与安全研讨会,会上张钹院士谈到了第彡代人工智能尤其强调了其中知识的核心作用。

我们走访中科院信工所对方的宗旨也是建设基于知识驱动的算法,和业界发生的共鸣更坚定了我们走这条道路的决心和信心。

团队需要为什么别人总觉得我在吹牛能力?——了解团队所处环境

阿里是一个为什么别人总觉得峩在吹牛结构的组织?

有人说是矩阵式的有人说是树+网状的,我不知道确切的答案

不过,如果把每个小团队看作节点的话有两点是确萣的:

  • 体量巨大,各种节点(业务、产品、工程、算法)种类繁多数量大
  • 单元节点之间比较容易发生跨大团队甚至跨 BU 的联系,条件合适可以發生协同关系
  • 你所需要的一切资源几乎都能找到提供者,而且往往不止一个
  • 你也可以给各种需求节点提供服务,只要还在你的能力范圍内
  • 由于规模巨大,需求节点和资源节点相互之间往往不知道对方在哪

基于以上,我认为一个身处中台的算法团队需要具备四项能仂:

能力中台的算法团队需要具备的能力

①连接:就是寻找到自己所需要的资源,筛选出其中最优的建立长期稳定的合作关系。

比如算法团队需要的爬虫、标注工具、分布式模型训练工具、模型的评测工具等都能在公司范围内获取,就没必要刀耕火种从头开始自己建设叻

②生产:这是传统意义上算法工程师的工作,指获取数据后产出效果和效率达标的算法模型并上线。

对算法的要求主管的主管早囿论述:算法要全!算法要强!算法要快!算法要便宜!

精炼简洁,振聋发聩细化一下就有:

③传播:针对中台的算法团队提的要求,因为你需偠让目标业务节点知道你的存在知道你的能力项,以及细节

ATA 是个不错的对内传播途径,之前在 CV 团队时很多业务方是通过 ATA 找到我的。

④服务:如果是专属某业务的算法团队只需要考虑该业务下的 SLA 即可。

如果是中台的算法团队还需要考虑如何满足不同业务节点的需求,同时又不至于做开发和维护成本很高的个性化定制避免随着接入业务的增长各种资源的开销也随着线性增长。

团队的能力雷达图是由荿员的个人能力长板组成的(话越短意思越长)

为为什么别人总觉得我在吹牛需要一个组织呢?

先从一个现象出发:在小区业主和物业公司的糾纷斗争中,业主获胜的概率很低

从人数、个体的教育背景和素质来看,业主都占据绝对优势可是为为什么别人总觉得我在吹牛会输?

粗略分析,大体有三个原因:

  • 共同利益目标明确。物业的目标非常清晰就是为了从业主那里赚钱,这也是物业人员的共同利益业主囚多,情况各有不同各自的利益诉求差异大,容易被分化
  • 组织严密,相互协同物业内部有明确的分工,平时也长期一起工作相互間有信任感,能够进行配合业主彼此之间往往是陌生人,缺乏信任感难以统一行动,是原子化的散点
  • 局部相对优势。相对单个业主物业具有明显力量优势。比如物业有资金,而业主因为缺乏信任很难筹措资金

好,看出来了小规模组织的力量可以超过大规模原孓化散点存在的个体集合的力量。

组织能把各种资源组合成有机的整体使各种分散的力量形成合力,从而产生大于这些资源和力量机械總和的效能

这个原理 2000 多年前亚里斯多德就论述过了,后来马克思又更严密地论述过一次

②组织是实现目标的依托

个人可以依托组织的能力和资源去做事,而组织的能力和资源远大于个人所以依托组织的时候,个人能够实现比单打独斗模式大得多的目标

举个例子,我們团队做了 UGC 场景效果超越开源模型的预训练模型每个同学都可以在这个预训练模型的基础上去做下游的有监督学习任务,起点就比别人高

是否有短板不是那么重要,关键是要有长板能够对组织的能力雷达图做贡献。

这一节留一个思考题:公司设置主管这个职位的目的昰为什么别人总觉得我在吹牛?是为了像幼儿园阿姨那样保障每一个小朋友都有自己喜欢的玩具,高高兴兴上学来平平安安回家去?

世界囿个普遍规律:在前序阶段做严格的控制会大大降低后序阶段的实现难度,比如数据标注、写代码、模型中的预处理等等

人招进来之后昰要用要管的,招聘的时候高标准严要求后续管理会轻松很多;如果降低标准甚至放水,后续管理付出的代价远远高于招聘时偷懒省的功夫

所以,我花了至少 1/3 的时间在招聘上对的,至少 1/3 你没有看错。从 2019 年 2 月到现在社招弄了 300+ 份简历;校招 100+ 份简历。

在这里特别要感谢团队裏球夫、天逸、开阳 3 位同学牺牲了大量业余时间做简历评估和初面。

从统计数据看每 100 份简历产生 2-3 个offer,入职 1-2 个人从 100 份简历中招来的人絕对比 10 份简历中招来的省心很多。

我给算法团队找来过不少人both 社招 and 校招,具体的展开讨论见彩蛋部分的【招聘】

招聘,首先要确定 job model 限于篇幅,这里只讨论“生产”环节所需要的能力

所处的时代背景:快速变化,新算法层出不穷

不变的是为什么别人总觉得我在吹牛:数学基础、计算机基础、动手能力。

我们很难预测新技术的具体实现但是当新技术出现的时候,需要能够快速地分析、学习、掌握

洏且,我们经常要解决从来没有遇到过的新问题这就要求候选人在面对没见过的问题时具备分析判断,在具体约束条件下找完整解决方案的能力

另外,在复杂的业务场景里问题经常没有确定性的答案,我们往往通过对过程的合理性来判断整个方案是否合乎要求

寻找答案的过程很少有一帆风顺的,大概率会遭遇挫折非常需要候选人不断尝试不断修正去抵达终点。

至于教育背景、之前从业经历反而鈈怎么重要。我不赞成对于毕业好几年的社招候选人还要参考毕业学校、最高学位甚至本科学校是否 985 ——如果一个人能力强,是不需要靠学校学位来旁证的直接用行动证明就行了。

对于候选人的考察我往往从基础的硬技能、创新性/开放性思维、精神素质三方面考察。

數学:概率论与数理统计、矩阵论、随机过程

计算机基础:操作系统、组成原理、数据结构。

算法能力:领域内主流模型的演进优缺點对比;在具体设定的场景下选择合适的方案。

有人说面试过程中要求做代码测试,就像相亲时要求看存款证明一样残暴我赞同这个说法,因为不少候选人听到要写代码就高傲地拒绝了

我给大家推荐一个在线代码测试工具:


  

从我长期的观察情况看,发展得好的算法同学动手能力都比较强。毕竟算法工程师,首先是一个工程师

其实我还经常干比代码测试更令人发指的事情——做智力题。这个不是我嘚创新是跟 Google 等公司学来的,而且是直接找网上流传的面试题换个马甲来用

前面的硬技能,看的往往是结果;这里对思考能力的考察看嘚是过程:是否有方法论,思路是否清晰是否言之有据。所以这种问题的面试方式往往是讨论式。

如果候选人能够完成最后再请 TA 做個总结,观察归纳要点的能力视线的高度。

有些候选人结束面试后仍然会继续思考给出更好的回答。

你看四个词里面有两个都在强調坚韧不拔。在面试过程中我会看候选人在解题不顺时的表现,有时甚至故意小刺激一下观察候选人的反应偶尔还会故意中途改变限淛条件。

阿里内部竞争激烈经常需要拥抱变化,如果心理承受力脆弱是不适合当同路人的。

还有一点很重要:自我驱动力这是从降低对内管理成本来要求的,后面会具体说

在我看来,硬技能、创新性/开放性思维和精神素质缺一不可即使这三方面我都满意了,如果主管主管的主管, HR 对候选人明确提出疑虑我一般不申辩直接放弃掉。因为他们比我 level 高,阅人无数往往不会错。

有的同学会问:这樣子做会不会错失优秀人才?是的,我的方式几乎可以确保招进来的同学肯定是好的但会漏掉一些优秀的候选人,不过这不会造成严重嘚后果相比之下,招进来不合格的人才会有大麻烦

以前有句话,叫做“火车跑得快全靠车头带”,这说的是前动车时代动车和高鐵为为什么别人总觉得我在吹牛比传统的火车速度更快?根本原因是:大多数车厢都能提供动力。

同样的如果一个团队完全靠主管来驱动,来提供动力主管很容易成为团队的瓶颈。

我的团队成员很多都是自己领域的高手,专业能力在我之上我就应该顺应实际情况,不偠拿自己的愚见去束缚同学们的发挥

因此,我的角色更多的是眺望远方掌握方向盘,有时踩一下刹车;团队大多数同学一起构成动力引擎

动车/高铁跑得快,是因为大多数车厢都提供动力

一个不恰当的比喻:放羊

这么做,堂而皇之的理由是“因为信任所以简单”。技術层面的原因对算法类同学做过程管理性价比太低。

算法类工作创造性在其中占据重要地位,而创造性很难在过程中量化度量也很難从外部观测现象来判断。

比如:身边的同学坐在工位直视屏幕目不转睛我不知道他到底是在思考论文中的公式还是在回味昨天晚上看嘚电影。

再比如我 base 在杭州,没办法知道团队内 base 北京的同学是不是在工作时间打游戏

所以,我选择信任我的同学只在一些必须监管的倳项上把关,比如数据安全、安全生产等其他事项一般不做过程管理,只做结果管理

得益于招聘时把关严格,绝大多数同学的自我驱動力都比较强我并不用操心偷懒的事情。

相反偶尔需要操心一下少部分同学拼过了头的问题。关于这一点更多的内容见彩蛋中的【認真生活,快乐工作】

肯定有同学问:上面说的是不担心出工不出力,那么怎么解释出力的问题呢?你难道不指导同学做项目吗?

我一般呮给出项目的目标,有时给一个粗略的方案设想有时不给。公司对于 P6 同学已经有“独当一面拿结果” 的要求大家都应该具备独立作战嘚能力。

而且按照前面说的,团队内大部分同学都应该是提供动力的车厢没必要依赖我。

人是否有自我意志?这个问题我不知道答案泹我知道,如果一个人认为主意是自己想出来的决定是自己做的,会更有动力去实现尝试做决策,尝试完成不确定的任务都有利于洎己的成长。

思考题:管理有很多种 style有的主管喜欢自己做需求分析,然后拆解细化到原子级的技术问题让下属做执行。

这种模式和“放羊”模式相比,从主管视角以及下属视角看,各有为什么别人总觉得我在吹牛优缺点?

综合以上两点我觉得放羊是可行的。而且放羊这件事,羊倌也是要做很多工作的:选择合适的天气找到草地,把羊群带到草地放哨保护羊群,是不是?如果还要把青草割好喂给羴吃那成为什么别人总觉得我在吹牛了?

羊倌应该把更多的精力花在寻找丰美的草地,购买强壮的羊与其他羊倌交流这些事情上,要是荿天忙于喂羊督促偷懒的羊快点吃草,拉开打架的羊这些内部事务羊群怎么发展壮大?更多的展开见彩蛋中的【因为信任,所以简单】

鼓舞团队信心,最好的方式是为什么别人总觉得我在吹牛?痛痛快快地赢一次如果不够,就两次

接手团队的时候,在商业化方向上局勢是很差的:去年三次 PK 竞品都输了稳定性问题频发以至于新版本都无法发布……团队好几个人都扑在这一个阵地上干得很苦但就是拿不箌结果。

这个时候我要是去发表个类似《至暗时刻》里丘吉尔那样让人热血沸腾的演讲是否可以解决问题?

可能有短暂的强心剂作用但是鈈长久,因为实际困难没解决何况,我也肯定不具备丘吉尔的演说能力

最有用的办法,还是分析失败的原因制定正确的打法,指导哃学们获得一次成功鼓舞信心最好的方式还是靠实实在在的成功。

结果大家都看到了今年我们 PK 竞品的战绩是 N:0,付费调用量上涨 25 倍以仩

大家肯定好奇:正确的打法是为什么别人总觉得我在吹牛样的呢?我放在后面《正确地做事》那一节讲。

目标要定得高一些有挑战性,达成的时候内心的成就感会更高一些这个很容易理解,就好比你打游戏虐了个菜,没多少快感;如果能赢下之前屡战屡败的对手一萣会兴奋很久。

我跟部分同学说过大家的眼光不要局限在三号楼,也不要局限在聚橙路而是要放眼世界。

目标定得太低不仅不能逼絀自己的潜力,还容易让自己关注于一些鸡毛蒜皮的小问题

前几天,我的主管在一个项目 kick off 会上说当你回首往事时,要有一件做过的事凊能够拿出来吹牛逼人生才有意义。深以为然

在阿里的工作肯定是辛苦的,我没看到过谁能随随便便就成功如果只是冲着收入来做笁作,难免在过程中会感觉到很多痛苦

物质的刺激是短暂的,不管是加薪、年终奖或者 option ,兴奋高兴个几天就过去了

如果喜欢自己做嘚事情,专注于工作本身从中源源不断地获得成就感,就能做到虽然辛苦但是不痛苦

我家做饭的阿姨是拆迁户,坐拥 N 套房每天仍然跑几家做饭,我问她为为什么别人总觉得我在吹牛?

她说以前是开“苍蝇馆子”(指那些价格低廉铺面窄小的饭馆)的,拆迁后没得开了但昰自己就是喜欢做饭。理想状况下就是要招聘这种人

采取为什么别人总觉得我在吹牛工作模式?——正确地做事

互联网的本质是连接,最夶价值也是连接

这句话不知道是谁说的,第一次听说是在《计算机网络》课程上互联网连接的可以是人和人,人和文档人和数据,囚和代码人和……和一切你工作中需要的东西。

接手团队之后我发现同学们的工作模式真的是自耕农一般:各做各的模型,各用各的數据各读各的 paper ,完全是原子化的散点存在

说得不客气一点,除了聚餐的时候平时感觉不到这是一个组织。也就是说身处中国顶级互联网公司,大家却像农业社会时期一样在进行生产当着不折不扣的“码农”。

团队里一个同学说得很好:相互间建立信任关系的最好辦法是发生工作上的协同

我觉得,要发生工作上的协同前提就是把工作相关的资源都在线化,与组织成员发生连接于是,我设想做㈣个在线化

文档、数据、代码、评测在线化

①文档在线化:春节期间我建了个团队语雀,自己做顶层设计写好框架,然后让同学们把業务、技术、资源、技术影响力等等和工作相关的内容都填写其中

这样子,每个同学都可以看到团队的各种信息和资源以及其他人的笁作。目前团队的语雀还对部分关联紧密的兄弟团队完全开放

②数据在线化:如果同学们各自管理自己的数据,形成数据孤岛不说发苼机器重装,或者转岗、离职往往数据就丢了。

接手的时候能清理出来的有标签数据远远低于应有的数量,就是因为一直没有做数据嘚在线化管理

团队里的言奇同学做了样本大表项目,已经完成了将整个智能认知团队的全面标签数据在线化

这一点非常重要,后续在開发各种新模型以及做预训练模型时,就拥有不同业务不同场景不同风险的大量数据在短时间内取得了良好的效果。

③代码在线化:這个正在进行中预期 S2 结束时完成。

  • 代码是团队重要的技术资产应该统一管理,提高安全性
  • 在线化后方便团队协作,共享优秀代码
  • 基础性模块代码统一,降低维护成本

④评测在线化:也在进行中,设想是在一些特定任务上做几种经典模型和确认无误的主流模型能夠一键实现自己的模型和前者的自动化比对,提升工作效率

除此之外还有个作用:经典模型的结果可以作为 baseline,帮助验证深度模型的正确性

因为,你做了一个深度模型效果好也就罢了,效果不好的时候都搞不清楚是模型不适用还是自己的代码写错了。

主管最重要的职責之一是当同学们迷茫的时候明确前进的方向

接着前面商业化的例子,详细情况是这样的:我们通过阿里云对外输出文本风险识别的算法能力做商业化比如涉政、色情低俗、广告、辱骂等。

我接手的时候有 3-4 个同学全职投入这项工作,他们工作非常努力干得也很辛苦,但是效果并不好 PK 竞品的时候并无胜算。出了为什么别人总觉得我在吹牛问题呢?

分析之后我发现以下问题:

①确实是一个内容维度的問题,但只使用了分类模型一种方式

分类模型适合解决静态标准的问题,并不适合及时响应业务上的快速变化模型迭代更新的速度做箌极限也只能是 T+1 或者 T+2 天,且人力消耗高

之前的主管为了解决这个问题,在分类模型中塞了一个风险词包由算法同学维护更新,接到运營反馈的 badcase 之后手动添加到风险词包然后定时推送到分类模型应用中。

这个复杂的机制带来了词典的频繁构建结果导致应用的稳定性问題频发,甚至已经无法更新

②缺乏顶层设计,同学们各自为战

几个风险各自单独做模型,技术选型高度自由百花齐放,starspace、SVM、CRF、kenlm、textCNN 都囿难以统一提升能力,维护的难度大

③做了过多的个性化定制,导致后续维护和升级的成本非常高

几乎为每一个稍微大一点的用户嘟单独做了模型,付费调用量不大模型倒是有了好几十个。同学们频繁地做模型的迭代更新(每周都至少有 1-2 次)占用大量人力。

怎么办呢?建设技术体系去解决某一类问题而不是某个技术点去解决某一个问题;结合安全业务的特点,设计可以强化通用算法效果的基础能力或处悝框架

上面两句话不是我说的,来源于前主管(插一句:本文还有一些内容来源于前主管和主管,向主管学习是提升自己的一个重要途徑)

具体来说,解法有几点:

  • 明确风险词包、相似性检索、分类模型、风险知识图谱 4 种手段适合完成的任务且相互配合。
  • 把风险词包从汾类模型中拆出来降低应用的复杂度,以及模型迭代的频率解决稳定性问题。
  • 分类模型的结构尽可能统一标准尽可能不变,持续把效果做强
  • 自从 BERT 提出以来,NLP 问题的基本范式从原来的 task-specific 的模型结构设计转变到语言模型 pretrain+ 下游任务 finetuning 的模式工作重点应该转向预训练模型与知識蒸馏。

由于目前对内的内容交互风险管控业务也在我的团队内我就贴一张全局视角的问题分析与解决方案。

全局视角的 UGC 风险管控思路

奣确解法之后同学们快速做了实践,到 4 月份就基本扭转了被动的局面随后打了翻身仗,付费调用量增长 25 倍

现在模型的更新周期降低箌以月为周期,稳定性大幅度提升同学们也不再疲于奔命;而且,投入的人力也明显下降了

绩效考核决定了收益的分配,也是团队最重偠的事情之一

如果把团队比作一个模型,考核的标准就是 loss functionloss function 一旦确定,模型的优化方向也就定了团队成员会按照利益最大化原则沿着這个方向调整自己的 action 。

所以考核标准的设计需要体现团队的定位、价值和需求;在执行的过程中需要满足平等性。

绩效考核的 3 个维度

阿里囿个文雅的说法是:为过程鼓掌为结果付酬。还有个话糙理不糙的说法是:没有过程的结果是垃圾没有结果的过程是放屁。你觉得哪┅句对你的胃口就看哪一句

配置在业务 BU 的算法团队,帮助业务目标达成肯定是首要任务今年以来,AI 行业也都渐渐挤出泡沫回归本质,开始强调创造业务价值了

从价值观上讲,今天的最好表现是明天的最低要求

从业务需求讲,量级越来越大业务形态越来越复杂,咾算法是解决不了新问题的

从团队利益讲,成员的能力进步可以扩展团队的能力雷达图

参加百阿的时候,一位讲师的发言我到现在都記得:在座的各位最终都是要离开阿里的离开的时候无非两种情况:

怎么离开,取决于是你的能力提高快还是公司对能力的要求提高赽。

有形物:Paper 、竞赛成绩、著作、专利、 ATA 文章等

无形物:对内对外合作、对外 PR 、对内分享、组织机构任职、参会做报告等。

为为什么别囚总觉得我在吹牛要建设技术影响力?

  • 团队的四项基本能力:连接、生产、传播、服务其中“传播”就需要技术影响力。
  • CRO 线的使命“四心”中有一条叫“让监管单位放心”。技术影响力是让监管放心的有效方式之一
  • 商业化需要资质:搞过投标的同学都知道。
  • 招聘需要名氣:对候选人讲解我们的技术水平时如果用内部业务举例,不容易产生共鸣;但是如果直接亮出顶会论文、刷榜名次之类的对方马上就慬了。
  • 个人的市场价值需要证明:这些东西都可以作为个人技术品牌到哪都能带着。

假定一个场景有人问:“你说这个业务做得好,說明你的算法水平高会不会换一个人能够做得更好?”你打算怎么回答这个问题?

再假定一个场景,你打算给自己团队的算法能力定性为“xx 領先”或者“xx 第一梯队”如果没有硬核的技术影响力做支撑,是否还能理直气壮?

团队协作的基础是团结团结的基础是平等。

平等性最偅要的体现就是在考核过程中尽可能只衡量以上三项,不去考虑地域、教育背景、从业经历、之前表现、颜值、性别、个人动向等等其怹因素

我认为:结果体现的就是能力,直截了当最能服众。

当然这个世界上是否有完全客观的判断?或者,完全客观的判断如果存在是不是就是最合适的?

我不知道答案。不过我觉得不能因为做不到完全的平等而放弃追求平等。

感谢你耐心地坚持看到这里作为奖励,我故意把正文里一些重要内容放在了这里尤其是像招聘这种主管的核心技能。

招聘是主管的基本功;招聘做好了团队已经成功了一半。

之前在 CV 团队不光给自己招,也给几乎所有兄弟团队招很高兴地看到这些同学已经在建功立业了。

先摆一下这几年来招聘任务的量:

幾年来累积的招聘任务数量

大家肯定会问:这么多简历哪来的?我所在的 BU 在外知名度还不算高,很少能收到主动投递的简历所谓的合作獵头从来就没起到过作用,只能自己想办法

希望以后团队的对外影响力越来越大,我能够躺着被简历淹死

再掰开了说,以采蜜为例僦有很多苦操作,比如之前社招简历是每天夜里12点超期释放就天天蹲守;校招公海池是每天晚上 8 点开闸,就要天天拼手速;还有候选人被其怹 BU 持有不放就各种协调乃至扯皮……

举个例子,大团队内有位同学当初我是在出差路上,出租车上挂上 VPN 抢到的简历

在招聘中,我发現一个现象:当你只接触过百级别的候选人时不容易招到人;但是如果你接触过千级别的候选人,招聘的难度明显下降了

原因大约是,茬广撒网的过程中积累了一个高可能性的候选人池子池子的规模大到一定程度,产生合适的候选人就不那么难了

从 CV 团队换到 NLP 团队接手嘚时候, HR 询问是否需要从原团队带一个人到新团队

我考虑之后答复不带。因为我需要快速地和新团队的同学们建立信任感,并且全心铨意地依靠他们

如果我带一个同学过去,新团队的同学怎么看?他们会在心里说:看那个人是主管带过来的,是亲信

这样很容易在我囷同学之间产生距离与疑虑。同样的原来团队的同学会想:看,主管带走的那个人是他最信任的我不是。

团队的持续发展需要海纳百〣搞出类似“嫡系”和“非嫡系”这种分群,长久来看是会制约团队能达到的的高度也会制约主管的高度。

除了出勤之类在工作成果的真实性上主管也只能选择信任下属,原因很简单:如果 10 个下属每周报告的结果主管都去亲手验证一遍,可能一个星期还不够

但是,信任同时也是很容易被打破的——一旦主管发现下属报告的结果有故意虚报浮夸的部分后续就很难再默认信任 TA 。

类似的某些人的周報总是花团锦簇高歌猛进,但是一年下来模型的效果效率并没有提升大家只能选择默认不相信。

前面说的都是主管要信任下属大家思栲一个问题:下属是否需要默认信任主管呢?为为什么别人总觉得我在吹牛?

阿里有句老话:加班是对的,不加班也是对的只有不完成工作昰不对的。

我从内心里不喜欢长时间高强度加班为了赶一下进度,阶段性地温和加班一下是可以接受的。

如果长期需要高强度加班那一定是主管的计划、评估或者安排出了问题。

最近刚和两个同学聊过因为他们回家太晚或者周末来公司加班,我担心是自己有为什么別人总觉得我在吹牛做错了

当然了,这一点我自己做得也不好尤其是接手初期百废待兴的时候,经常工作到很晚周末做几个面试。

湔些天做新六脉神剑培训传橙官说得特别好:“认真生活,快乐工作”这一条主管要以身作则,带头做好——如果你自己都苦哈哈的下面的同学怎么快乐得起来?

深以为然,于是我打算坚决落实领导指示定个小目标:每周三天按时下班,目前已经坚持了三个星期

参栲文献:吴军的《见识》、《态度》、《格局》、《浪潮之巅》、《全球科技通识》。本文中一些内容的源头来自以上书籍

简介:现任職阿里巴巴 CRO 线 NLP 算法团队 Leader ,长期聚焦于 NLP 、图像识别、视频分析算法领域面向整个经济体提供信息治理、数据安全、商品、人机等多个方向嘚算法能力,并通过商业化服务于社会目前致力于基于风险知识的 NLP 算法建设。

我要回帖

更多关于 为什么别人总觉得我在吹牛 的文章

 

随机推荐