• 效率
    如何用机器学习手段提高HR甄别简历的效率 如何用机器学习手段提高HR甄别简历的效率引言“假设简历库中有10000份名为“软件工程师”的简历。 一位HR在搜索“Android工程师”时仅关注名称为“Android工程师”的简历,她将遗漏912份有可能匹配的简历;如果这位HR愿意花时间从头到尾通读每一份“软件工程师”的简历,将其中真正从事Android研发的简历筛选出来,那么她需要多阅读9088份无效的软件工程师简历。假设阅览一份简历需要15秒,这项工作将占据她38小时。“  一、低区分度的简历——隐藏的招聘雷区 搜索和阅读简历占据了招聘的大部分时间。在HR搜索或阅读简历时,需要根据简历名称或工作内容对简历类别进行判断,简历类别的“区分度”越高,HR越容易通过搜索定位到对应的简历,也越容易甄别出简历与空缺岗位的匹配度。 例如,HR在招聘一名“Android工程师”时,非常喜欢那些在职位名称为“Android工程师”的简历,因为可以很方便地搜索和识别。这部分简历可以定义为高区分度简历。 可令人头疼的是,许多候选人的简历并未照顾到招聘者的使用体验。例如一名软件工程师在他的简历中提到了多项编程技能,并将简历名称定为“软件工程师”,给系统搜索定位到这份简历造成了极大的难度。这就意味着:由于JD的编写方式与候选人编写简历方式的天然差异,大量履历匹配的简历在搜索时被遗漏,许多工作内容里包含这些关键字的简历(比如招聘专员)实际却又毫不相关。 二、大量的低区分度简历增加了甄别难度 我们从简历库中抽样了1479818份互联网行业中包含“工程师”的简历数据,按简历名称进行统计,从高到低排序后截取Top15展示如下: <图1-高频职位名称统计数据> 由统计数据可以看出,类别区分度低的简历在整体简历数据中占比较大。例如互联网行业中包含大量“软件工程师”、“高级软件工程师”、“软件研发工程师”、“研发工程师”简历,占抽样总数的25.7%,但这部分简历却无法轻易判断候选人对应的技术方向。 实际上,Java工程师、PHP工程师、后端开发工程师等均可称为软件工程师。有众多Title为“软件工程师”的简历,需要根据职位或工作描述进一步判断具体类别。 例如对简历进行搜索时,输入“Python工程师”,简历名称中含Python的简历可能较少,导致搜索结果数量丰富度不高。但如果通过模型可以判断简历名称为软件工程的具体角色,增强简历的区分度,则可在软件工程师的简历中筛选属于Python工程师的简历,进一步提高搜索的丰富度。 三、通过机器学习方法提高角色识别的准确度 1、建立合理的职位理解 增强简历的区分度,可以理解为“如何更准确地理解职位,包括职位的不同表达方式,以及与该职位相关的技能模型”——这件事可以基于一张专业词表完成。 例如我们定义一个简单的词表——“软件工程师”为一级类别,其下属二级技能类别分为Java、C++、PHP、.NET、Python、Delphi、Perl等。这张词表定义了明确的职位/技能关系,当词表在“阅读”一份名为“软件工程师”的简历时,它实际阅读的是上述技能。 聘宝的知识图谱更为复杂,除技能分支外,还包含行业、公司等众多维度。 <图2-聘宝的职位技能知识图谱节选> 2、如何进行高效的角色分类识别计算 深度学习方法近期在文本处理领域大受欢迎,但需要注意的是它们的训练以及测试过程十分缓慢,以至于工程应用时门槛颇高。 在进行了一系列的技术方案调研与比较后,我们尝试对比分析了三种机器学习的文本分类算法: TextGrocery,fastText,Naive Bayes。 · TextGrocery—是一个基于LibShortText和结巴分词的短文本分类工具,基于线性核SVM分类器,使用二元分词(Bigram),不去停顿词,不做词性过滤同时支持中文和英文语料,让文本分类变得简单。 · fastText—由FAIR(Facebook AI)开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,出自Word2Vec作者Mikolov的论文《Bag of Tricks for Efficient Text Classification》 fastText适合大型数据+高效的训练速度,能够训练模型“在使用标准多核CPU的情况下10分钟内处理超过10亿个词汇”,与深度模型对比,fastText能将训练时间由数天缩短到几秒钟。FastText的性能要比时下流行的word2vec工具明显好上不少,也比其他目前最先进的词态词汇表征要好。 <图3-fastText分类器模型示意图> <图4-fastText模型架构> · Naive Bayes——由贝叶斯定理延伸而来的概率模型,它根据每个特征的概率确定一个对象属于某一类别的概率。该方法假设所有特征需要相互独立,即任一特征的值和其他特征的值没有关联关系。 在自然语言处理领域,处理的的数据可以看做是在文本文档中标注数据,这些数据可以作为训练数据集来使用机器学习算法进行训练。 在训练样本时,构建可以表征文本的特征向量(词汇表),并根据这个特征向量将训练集表征出来,计算各个类别的频率作为该类的先验概率,和在每个类别条件下各个特征属性的条件概率,分类时,根据贝叶斯公式计算待分类句子在每一类别的后验概率,取最大值作为其分类。  <图5-Naïve Bayes模型架构> 四、一个简单的分类识别实验 为更好地分析不同技术手段在增强简历区分度上的效果,我们进行了一项简单的比较实验,来展现算法是如何把低区分度的简历如“软件工程师”进行具体的技能方向分类的。 1、实验数据集的准备: 选取680731份根据职位名称判断属于二级类别的工程师简历数据,随机抽样取80%的数据做训练数据,剩余20%份作测试数据。 <图6-实验数据集的分布> 2、实验效果表现: 通过实验我们发现,通过机器学习方法,我们能够快速识别低区分度简历并进行准确的分类,从而能够极大的降低人工搜索与阅读的时间。                                                                     <图7-各个类别预测准确率的分布> 对比上面模型结果, fastText模型基于词袋的针对英文的文本分类方法,组成英文句子的单词是有间隔的;而中文文本是连续的,因此对中文文本,则需分词去标点转化为模型所需要的数据格式,但分类效果一般,尤其是类别间区分度不是很大的情况下。另外参数调优对模型结果影响较大,但模型优势在于训练时间很短。所以fastText模型更适合做类别区分度更大且讲究分类效率的应用场景,比如将一则新闻自动划归到财经、军事、社会、娱乐等板块。 TextGrocery模型是专门针对短文本的分类模型,直接输入文本,无需做特征向量化的预处理,不去停顿词,不做词性过滤,优雅的API接口,但模型准确率和模型训练时间在此角色预测模型中不是太突出。 Naive Bayes为传统的文本分类模型,特征向量化的预处理相对繁琐、训练时间较长,但在分类类别多文本区分度不大的情况下,分类效果相比其他两种算法更为优秀。这个实验结果侧面说明,在产品实现时勿过度追求“时髦”的技术。对某一项特定业务来说,有助于业务实现更优效果的技术就是最好的技术。 聘宝在面对低区分度简历时的角色识别算法,吸收结合了上述各类算法的特点,面对不同场景条件时搭配应用,实现了更优的分类效果,在TMT行业主要职位类型上的识别准确率高于75%。 以“软件工程师”为例子,在聘宝中输入属于软件工程师的职位描述,预测出可能的角色,效果如下图: <图8-聘宝角色识别效果示例> 对于其他行业低区分度的简历,同样可以训练出对应的模型。如果单个行业预测类别不用过细的话,可以将众多行业数据混合一起训练模型进行预测。 基于该实验的样本数据,假设简历库中有1万份名为“软件工程师”的简历。 一位HR在搜索“Android工程师”时仅关注简历名称为“Android工程师”的简历,她将遗漏912份有可能匹配的简历——这些简历均被冠以“软件工程师”的职位名称;如果这位HR愿意花时间从头到尾通读每一份“软件工程师”的简历,将其中真正从事Android研发工作的简历筛选出来,那么她需要多阅读9088份无效的软件工程师简历,假设阅览一份简历需要15秒,这项工作将占据她38小时。 角色识别除了在简历检索方面的应用,在其他方面也有广泛的应用空间。 如薪资预测, 根据工作描述预测角色作为特征变量,将有助于提高预测薪资的准确性。 又例如简历解析, 将简历详情页的各个区块作为文本,预测各区块所属的信息类型(如工作经验、教育经历等)后再使用对应的解析程序对区块进行解析,将大大提高简历详情页面的解析效率。 我们始终相信技术可以提高工作效率,也正因此我们在简历的分析与匹配工作上持续深耕三年,相信在机器学习技术的帮助下,HR的招聘工作将变得更加省时高效。   来源:聘宝   参考文献: [1] 超快的 fastText[EB/OL].https://sanwen8.cn/p/4744TBs.html, 2017-04-10/2017-04-24. [2] Library for fast text representation and classification.[EB/OL].https://github.com/facebookresearch/fastText, 2017-04-10/2017-04-24. [3] TEXTGROCERY,更好用的文本分类PYTHON库[EB/OL].http://blog.chedushi.com/archives/11383?utm_source=tuicool&utm_medium=referral, 2017-04-10/2017-04-24. [4] LibShortText简要入门[EB/OL].http://guoze.me/2014/09/25/libshorttext-introduction/, 2017-04-10/2017-04-24. [5] NLP系列(2)_用Naive Bayes进行文本分类(上)[EB/OL].http://blog.csdn.net/longxinchen_ml/article/details/50597149, 2017-04-10/2017-04-24. [6] 从Naive Bayes到N-gram语言模型[EB/OL]. http://blog.csdn.net/longxinchen_ml/article/details/50646528, 2017-04-10/2017-04-24. [7] Bag of Tricks for Efficient Text Classification[EB/OL]. https://wenku.baidu.com/view/32db1350777f5acfa1c7aa00b52acfc789eb9fba.html, 2017-04-10/2017-04-24.  
    效率
    2017年04月28日
  • 效率
    商业世界的11条真相:大部分公司的老板在给员工打工 本文来自微信公众号“小马宋”(zhongguowenlian),作者:小马宋。出处虎嗅网,原文链接https://www.huxiu.com/article/184077.html   做营销顾问的时间越长,接触的行业和公司越多,就越发现一些问题并非我们想象得那么简单。 不太有时间,所以今天继续锤子便签体。 1、我们被新闻报道蒙蔽了双眼,以为世界上都是谷歌、亚马逊、facebook、特斯拉那样的公司,至少也是阿里巴巴、腾讯、百度或者罗辑思维之类的公司。其实我们遇到的绝大部分公司都是平庸的公司,你学到的优秀公司的经验和技巧,在这些公司可能永远都行不通。 2、平庸公司的存在,造就了大批适应平庸公司规则的平凡的职业人物。 3、几乎每个行业都有为人不齿的秘密,那些致力改变这些黑暗规则的、理想远大的公司往往还没做成就死掉了,或者永远都是小公司。但是也有挑战黑暗规则成功的公司,比如做真房源和不再打电话骚扰的某房产中介公司。(我要是写名字,留言区就会有一堆说发广告的,其实大家都能猜得到) 4、大部分公司的效率之低实在惊人,但是它们依然还没有死亡。 5、总有一部分公司经营惨淡,总有一部分公司躺着赚钱,但这些公司都不太引人注意。 6、即使那些叱咤风云的公司,在内部人看来,依然有很大问题,世界上不存在完美的公司,如果有,那一定是有人在说谎。 7、在内部人看来,自己公司、自己行业的成功和经验如此简单,但另外一些公司就是学不会、想不通。所以跨公司、跨行业的学习非常必要,我就在我的客户之间扮演了这种知识搬运工的角色。 8、某些取得巨大成功的公司老板,并不了解自己成功的真正原因,这种归因能力的缺失,导致他的下一次创业或者转型几乎都会以失败告终。 9、永远都有商业理论模型解释不了的新公司形式,但是只要逻辑上自洽,它依然可行。 10、利益相关方公开宣扬的成功案例,往往都是包装过的,你最好去私下去询问当事人这个事情的真相。 11、商业是个充满谎言的世界,但这才是真实的世界,如果没有了谎言,就像没有了美图功能,朋友圈会变得好没意思。 12、与我们以为的相反,其实从大部分公司的情况看,都是老板在给员工打工。
    效率
    2017年03月07日
  • 效率
    远程办公如何执行才能效率高,这家公司做了典范 编者按:远程办公不再是朝九晚五的工作,你会更多自己的时间和自由。本文作者Alyssa Mazzina详细地介绍了这种新型工作模式。 在 Stack Overflow,我们经常谈论为什么我们选择远程办公,结果显示这样做非常有成效。事实上,2016年公司参与度调查显示,88%的远程工作者感觉参与度高(全公司85%的员工参与了此调研,这一数据的行业平均率为71%)。远程工作者还评价从整体上来看“工作生活融合程度”和“社交联系紧密度”比一般雇佣关系更高。 那么是我们如何实现远程办公的呢?它远远超越了你现在在公司看到的所谓的“允许你在家工作”政策。就像软件公司采用移动先行策略一样,我们公司采用远程先行的公司文化。 远程先行意味着远程工作是默认的,这就意味着必须确保远程员工与办公室员工一样成为团队的一份子。 这对于你的团队来说有吸引力吗?以下汇集了我们公司在实践中得出的很好的一些做法,如果你们想采用远程办公,可以参考一下。 会议 我们公司总共300多名员工,他们中有人在纽约总部(113人)、有人在丹佛办公室(44人)和还有人在伦敦办公室(64人)以及85名远程工作人员。我们需要精心设计开会的最佳方式。 对我们来说,远程办公意味着当我们与其他办公地点的人开会时,我们都是在Google环聊(Google Hangouts)中见。如果你在办公室办公,这就是你参加会议的地方;如果你在家办公,会议就在那儿。我们已经习惯这种做法,有时甚至在同一个办公室内的人会跳进一个环聊。在最近访问纽约办事处时,我很高兴看到我的两个同事坐在隔间,彼此只有隔板相隔,仍通过视频聊天进行对话。 在最初,这看起来很可笑,但是这么做是有原因的。如果我们都通过环聊召开会议,我们就都是平等的。如果我需要加入一场发生在任何地点的两人对话,我都可以加入,完全没有问题。在较大的会议中,这意味着在会议中没有站队的说法,远程办公不会使这件事情成为会议的一部分。当我在家里开会时,我不会知道谁在办公室,谁不在。每个人都在自己的桌子上,戴着耳机到Google环聊“远程”开会。 远程办公还意味着当某人想要陈述某件事情时,他们不是站在白板前边写边讲,远程办公人员隔着屏幕试图理解陈述者在说什么。我们是电子方式进行的,这就是说当有人提到某文件时,他们不会将其从文件夹中取出来然后发给桌上的每一个人,我们的做法是发送链接到整个组。 这些看起来很小,但它们不小。当你同等地对待两名同事时,每个人都有强烈归属感和参与感。这将为每个人带来更大的幸福感和更高的生产力。 聊天、Trello和Google文档 当我在工作时,我会开着很多聊天应用程序。Slack、环聊和我们自己的内部聊天都在后台运行着,我可以随时随地转换到不同的软件(当大家处在不同时区时,这非常有用),或者我可以单独找某个同事发起环聊,哪怕只是快速地问一个问题。聊天请求也可能反复出现,我可以忽略一个请求几分钟,先完成我正在做的事,再改变我的注意力(这一点就不像电话铃声或直接敲办公室门)。 我们还将Trello广泛用于各种项目和交流中。它帮助我们跟踪谁在什么时候做了什么。我的大部分文字工作都是在Google文件(Google Docs)中完成的,因此我可以轻松与他人分享、即时反馈和协作。 在家办公 我们的首席执行官Joel在雇佣远程工作人员时最先做的事情之一是为他们提供一个家庭办公室,包括办公室员工喜欢的所有设备和家具。我现在的家庭办公室里有一张Herman Miller的Aeron椅、有Steelcase的可调高度的书桌、有MacBook Air并接有外部显示器。全部都由公司提供。 每月,公司还会支付我一定的“家庭办公费”用于开支,如高速网络。 远程Bev Bash(饮料聚会) 每周,Stack Overflow的远程工作人员都通过环聊聚会,只是为了聊天和了解彼此的生活。这是我们纽约办事处的“Bev Bash”传统,其实就是快乐时光(Happy Hour)。因为我们不能在办公室度过一个快乐的时光,我们就创造自己的快乐时光。每个人都会带来一种饮料,通常有人被选为主持人(我们称为Bev Bash大亨),主持人还必须给谈话定一个主题。这些完全都是非正式的,我们的聊天走向就是聊到哪儿就是哪儿,没有限制。 这样的远程定期社交机会给了远程工作者同样的个人工作情景。它让我们有机会成为同事,成为朋友。 节假日 这是我在Stack工作后的第一个节日,但让我吃惊的是,我在这天收到了一份快递,里面装着节日礼物,东西和办公室里的每个人都一样。你认为远程办公者就会错过办公室派对吗?我们收到了一份小补偿,用于我们自己的节日派对——我们很多人将这部分补偿用于和对自己而言重要的人吃饭。这样的小事情提醒我们,我们真的是团队的一部分,而不只是事后才会被想起的人们。 底线 在Stack Overflow,我们大多数远程工作者都不像是在远程工作。我个人能够在家和喜欢的人一起工作,做着我喜欢的事情,真的是非常幸运,我知道我的所有同事都有同样的感觉。我们证明了远程办公团队可以像那些每周都在一起的团队一样可以密切合作。我们甚至更高效,因为如果我需要一个小时的宁静,我要做的是关闭我的通知,没有人会闯进我的办公室张口就问我事情。 全公司都在努力确保每一个成员都有归属感以及感到重视,无论他们在哪里办公。 翻译来自:虫洞翻翻 译者ID:YLS 本文来自翻译:www.stackoverflow.blog,如若转载,请注明出处:http://36kr.com/p/5064061.html
    效率
    2017年02月17日
  • 效率
    远程办公能提升团队工作效率?起码你要知道这些...... 办公空间解决方案供应商Regus 最新的研究发现:如果你想提高工作效率,你不需要给他们加薪、给他们更多的休假时间或者在休息室给他们添加运动器材(比如乒乓球桌)。你只需要让他们选择自己的工作时间和地点,你就可以坐等公司的生产力和收入的增加。   员工希望自己的工作时间和地点有更大的灵活性。现在很多公司也愿意迎合员工的喜好,满足他们的要求。这些公司采用的就是远程办公和办公室工作一体化。   “相关预测表明,到2020年有一半的劳动力会进行远程办公。但是我认为,在我们生活中早就有了远程工作。”专门为从事远程办公、自由职业、兼职工作或其它另外预定的工作岗位的人提供服务的求职网站FlexJobs的首席执行官萨拉·萨顿·费尔(Sara Sutton Fell)在采访中说道,“99%的工作人员之前都很担心自己要是在非工作地点检查与工作相关的邮件或是接到与工作有关的电话会很麻烦,但现在这种担心将不复存在,无论你是在办公室工作还是在家里工作你手上的工作都不会出现脱节现象。”   萨顿·费尔在采访中还说道,要是企业想进一步发展远程办公,正式进入远程办公的管理环境,他们可以向那些小型但在不断发展壮大的公司学习,那些100%的虚拟化运作的公司。在最近的一项研究调查中,FlexJobs 发现其中有76家企业的员工大都是在家里工作,甚至有的公司全部的员工都在家里工作,这些公司都来自不同的行业。萨顿·费尔对这些公司的结构进行分析过后发现,分散式的工作方式益于公司的运营策略和公司文化的发展,实践证明远程办公能够成功实现公司的有效管理。公司在进行远程办公时,需要注意以下几点:   1.选择正确的岗位 萨顿·费尔说,各种各样的职业都能远程执行,美国有一半的员工从事的工作可以实现远程办公。据FlexJobs的研究结果显示,其中最受欢迎的职业是创意总监,UI设计开发者,视觉设计工程师,会计以及营销经理。   “可以实现远程办公的职业范围已经从一些初级的工作扩展到像C级别高管这样的工作了,它可以是兼职也可以是全职;事实上,大多数职业领域都能实现远程办公。” 萨顿·费尔在采访中说道,“这些工作都有一个共同的特点,那就是它们可以靠通电话、发邮件或其应用程序完成。”   2.招聘合适的员工 雇佣远程办公人员最重要的一点就是他一定是一个值得信赖的人。“公司在招聘前一定要做好应有的调查工作。” 萨顿·费尔说,“你在和候选人交谈时要相信自己的直觉,对那些对你公司很感兴趣的人你一定要有敏锐的耳朵,仔细听他们的谈话内容。”   萨顿·费尔说,在招聘过程中通过多轮的交谈,能更清楚地知道自己公司到底需要怎样的员工。   千禧一代早就习惯了远程工办公,那么他们可能很适合虚拟工作。“当他们在大学的时候,他们不需要为了去图书馆而在校园里穿梭。” 萨顿·费尔在采访中说道,“他们可以在宿舍调查,研究,完成自己的学期论文。他们这一代,时间和地点都很随意,也就是说他们对不在办公场所办公很熟悉。”   3.要主动进行沟通 萨顿·费尔说,公司的成功需要靠远程的方式召开定期会议。经常通过电子邮件的方式让员工签到对公司的发展也很有帮助。   你应该拿起电话,利用像谷歌视频群聊这样的软件进行视频群聊。萨顿·费尔在休息期间会利用虚拟空间和员工一起喝咖啡。“我会经常故意这样做,其实这是一种周旋方式,有利于公司的发展。” 萨顿·费尔说,“它能让我跟员工的生活工作同步。”   4.工作时间要有弹性 除了那些处理客服事物的工作人员以外,萨顿·费尔工作团队里有90%员工都有自己的工作时间表。“他们的工作时间具有很大的灵活性” 萨顿·费尔在采访中说道,“公司花费在管理方面的时间,处理人力资源补假请求的时间都很灵活,灵活的工作时间能够减少员工工作中出现的不必要的摩擦,还能节省财力。”   要是你的员工是分散在全国各地的话,时区差异就可能引起一些问题的出现。萨顿·费尔说员工需要注意自己的工作时间和尊重其它员工的工作时间。公司要开会的话,应选择双方都有空的时间。   5.利用科技优势 萨顿·费尔说公司的老板会经常担心自己的员工到底在做什么,毕竟他们看不到员工的工作过程。这确实是远程办公一直存在的问题,但在科学技术发达的今天,就算员工不在办公室里工作老板也能知道他们在做什么了。   基于云计算的团队管理服务在不断发展,这对虚拟工作的管理来说很重要。FlexJobs使用的是一个以虚拟化形式提供办公功能的在线软件(Sococo),它能把每个人的工作境况以图片的形式呈现出来,模拟其在办公室工作,一起工作的同事就能知道每个时间点谁有空了。   “你可以通过鼠标点击来敲他们的门”萨顿·费尔,“就好比你把头探进别人的办公室一样。这款软件会增强员工的团队意识。当你没有出现在其他员工的视线里时,你的心思肯定不在工作上,但是不用担心,科技会让你乖乖的工作的。”   6.通过各种方法见面 成功的虚拟公司总会找各种方法与员工见面,萨顿·费尔说。许多公司会召开年度见面会,将整个工作团队的人员聚集到一起,促进员工之间、上下级之间的关系。其实,除了这个机会外,你还应该寻找其它的机会和员工之间见面。   当萨顿·费尔在旅行时,她总是试图和她的员工见面,要是她的员工恰好居住在她去旅游的地方的话。她还会鼓励自己公司里的其他人像她这样做。“如果他们中有人去公司其它员工所居住的地方附近旅游的话,他们可以用公费吃午餐或晚餐。”萨顿·费尔在采访中说道。   Source:fastcompany
    效率
    2015年05月28日
  • 12