招聘偏见不是招聘者的品德缺陷,而是人脑和算法系统在不确定中做决策时一种可以预见的特性。否认它存在并不能减少它,只会让它继续在看不见的地方起作用。
这篇文章是一份实用清单:当下国内招聘决策里最常见的11种偏见,每一种在漏斗里具体怎样显现,以及哪些做法能压低它的影响。它不承诺消除偏见,只承诺给出诊断和工具。
经典的人为偏见有哪些
1. 确认偏见
招聘者在面试的头30秒(或者第一眼扫过简历时)就形成了一个印象,接下来的整场对话都在为这个印象找证据。提问变成了为最初那个假设寻找佐证。
怎样显现: 候选人「过」初筛,往往是因为开场让人觉得舒服;「没过」往往是因为早早制造了某种别扭。
怎样降低:
- 用结构化面试,对所有人问同一套问题
- 在和同事讨论之前先写下书面判断
- 用封闭式评分量表,而不是「我觉得他表现挺好」
2. 光环效应(与犄角效应)
某个特别突出的正面(或负面)特征,会扩散到整个评价上。名校出身的候选人会被认为在所有维度都更强,沟通、推理、担当,哪怕没有任何证据。
怎样显现: 「他是清华的,分布式系统肯定厉害。」或者:「他简历上有18个月的空窗期,整个人大概都比较散漫。」
怎样降低:
- 分维度评估,每一维用独立量表
- 不要汇总成一个「整体印象」
- 技术测试匿名化(去掉姓名、去掉院校)
3. 相似性偏见
倾向于偏爱和招聘者相像的候选人(相同的社会背景、同一所学校、同样的爱好、相近的性格)。这是最难根除的偏见,因为它常常被包装成「投缘」或「文化契合」。
怎样显现: 「我觉得他这人挺对路,和我们能合得来。」这句话很多时候的意思是「他和我很像」。
怎样降低:
- 组建背景多元的面试小组
- 把「文化契合」(认同公司明确写出的价值观)和「社交契合」(和我像)区分开
- 在面试之前用书面标准把「文化契合」定义清楚
4. 锚定偏见
第一个数字或第一条信息会框住后面的所有判断。先看到的那份漂亮简历,会成为接下来20份简历的参照锚点。
怎样显现: 「这是这批里最好的」,通常指的是最接近第一份的那个。
怎样降低:
- 拿候选人对照评分量表,而不是互相对照
- 随机打乱评估顺序
- 每批评估之间留出间隔,重置锚点
5. 可得性偏见
我们会根据例子有多容易想起来,去估计概率。如果上一个不靠谱的开发是写 Vue 的,那么写 Vue 的候选人就显得有风险,哪怕没有数据支撑。
怎样显现: 「用某某框架的开发往往架构能力弱」,这个观点基于两三个个案,而不是统计。
怎样降低:
- 有汇总数据时,依据数据下判断
- 把团队内部的经验法则写下来,定期复盘
- 在能用客观测试的地方,用测试替代直觉
6. 现状偏见
无意识地偏爱和现有团队成员相像的候选人。它会主动削弱多元性,哪怕公司口头上说自己重视多元。
怎样显现: 整个团队都是男性、都来自头部院校、都做 Java 后端。下一个「合得来」的录用大概率还是同一种画像。「我们不是故意的」,恰恰是这种偏见之所以危险的地方。
怎样降低:
- 在开岗位之前先做一次有意识的差距分析(「我们团队还缺什么」)
- 从源头上让人才管道更多元(不只在那几个显而易见的渠道发岗位)
- 录用后按人群维度跟踪指标,每季度复盘
国内特有的偏见
7. 地域偏见
在国内,地域带来的隐性印象很强。一线和新一线城市(北上广深、杭州)的简历,往往比下沉城市或欠发达地区的简历得到更多注意,哪怕岗位本身是远程的。籍贯、户籍、第一份工作的城市,都会被悄悄读成某种「成色」。
怎样降低:
- 第一遍阅读匿名化(去掉籍贯、去掉城市、去掉户籍信息)
- 让候选人池在地域上更分散
- 按地域统计通过率,定期复盘
8. 学历与院校偏见
「985/211」「双一流」在第一遍筛选里被赋予了过高的权重。普通本科、专升本、民办院校出身的候选人,即便实际表现相当,也在竞争中处于劣势。第一学历歧视在国内尤其顽固,常常以「硬性门槛」的名义出现。
怎样降低:
- 把技术测试放在面试之前,且不暴露院校信息
- 按实测技能下判断,而不是按学校名气
9. 性别与年龄偏见
在技术岗位上格外顽固。署名男性的简历更容易被读成「技术能力强」,署名女性的简历更容易被读成「软技能好」。年龄上,「35岁门槛」是国内独有且被广泛默认的现象,许多岗位在筛选阶段就默默把年长候选人过滤掉了。这些都不是理论,而是被反复观察到的现实。
怎样降低:
- 第一遍筛选匿名化(去掉姓名、去掉照片、去掉年龄)
- 面试小组里有女性参与
- 把标准化的技术测试放在行为面试之前
算法偏见有哪些
10. 历史数据继承来的偏见
用过往招聘数据训练的 AI 模型,会学到其中的模式,包括那些你并不想复制的模式。著名案例:亚马逊(2018年)用十年招聘历史训练简历筛选模型,结果发现它会给含有「女子」字样的简历降分,模型随即被下线。在国内,Moka、北森这类招聘与测评平台,以及 BOSS直聘、智联招聘上的智能匹配,本质上跑的都是从历史数据里学规律的同一套逻辑,同样会继承数据里的偏见。
怎样显现: 一套 AI 筛选平台「莫名其妙」地比起 Y 人群,过滤掉了更多 X 人群的候选人。这不是被显式写进代码的,而是继承来的。
怎样降低:
- 对模型做偏见审计,用覆盖不同人群的合成样本测试
- 每年用更均衡的数据集重新评估
- 留存人工干预环节,让自动化排序的结果可解释、可申诉
11. 「简历优化」带来的偏见
那些靠关键词匹配打分的系统,会偏向学会了「为机器优化简历」的候选人,而不是技术上最强的人。这制造了一种次生偏见,专门误伤那些把简历写得简洁直接的人。
怎样降低:
- 把筛选环节从「读简历」挪到「测技能」
- 像 NORT 这样的平台,靠基于测试而非简历的职业评分,正面打击这种次生偏见
怎样判断自己有没有偏见(以及有多大)
光声明善意是不够的。四个可以落地的检验:
检验1:按人群拆解
按性别、年龄、院校等维度,比较每一阶段的通过率。如果某个群体在第二阶段到第三阶段之间的通过率掉得更厉害,说明偏见正在那个阶段起作用。
检验2:审查岗位描述
岗位 JD 里有没有带性别暗示的词(比如把岗位写得「能扛」「能拼」「狼性」,在国内语境里偏向男性化)?把这类措辞替换成对能力的客观要求。
检验3:受控的匿名评估
对同一批简历,分别用「带身份信息」和「不带身份信息」(姓名、照片、院校、籍贯)两种方式套用同一套评分量表。结果不一致,就是偏见存在的直接证据。
检验4:最终候选池的多元度
如果排名前10%的候选人是 X 画像,而最终录用的前10%是另一种画像,那么偏见住在漏斗里,而不在候选池里。
哪些做法听起来不错,却减不了偏见
- 只搞「无意识偏见培训」却不改流程:近期研究显示它只有短期效果,行为上不会持续改变
- 只喊口号定比例,却不改评价标准:制造反感,却没解决根因
- 只谈「归属感文化」却没有数据:没有度量的口号改变不了任何事
- 把 AI 当成人为偏见的自动解药:很可能只是用一种算法偏见换掉了一种人为偏见
NORT 在这件事上怎么发力
需要先说清楚一点:NORT 不是招聘管理系统(ATS)。ATS 管理的是申请流程和漏斗;NORT 做的是反向招聘加候选人测评,它和 ATS 互补,而不是取而代之。想了解漏斗本身怎么管理、又在哪里触及边界,可以读一读术语表里的招聘管理系统(ATS)。
在这个前提下,NORT 通过三个机制对付偏见:
1. 在预评估的候选池里按客观标准筛选:按实测技能、实测语言、经过验证的大五人格打分。简历退居次要。
2. 可携带的评估:候选人只做一次流程;企业在第一遍阅读时,没有按姓名、照片、院校筛选的机会。
3. 对候选人透明:结果对候选人本人可见,所以自动化决策是可被问责的。
它不会消除所有人为偏见(最终面试依然存在),但它把漏斗的瓶颈挪到了更经得起检验的地方,也就是技能的度量。
常见问题
偏见能彻底消除吗?
不能。但可以显著降低。研究显示,结构化流程加上首轮匿名评估加上清晰量表,能在多个人群维度上把偏见降低30%到60%。彻底消除需要拿掉人的决策,那又会带来别的问题。
企业按比例招人在法律上可行吗?
在国内,针对欠发达地区、残障人士、退役军人等群体的就业帮扶与定向招聘,有明确的政策依据,是被鼓励的。这和「按人群挑选某个候选人」不同,它是「面向特定群体开放岗位」。同时要注意,《就业促进法》明确禁止基于民族、性别、宗教等的就业歧视,企业在设置标准时需要守住这条底线。
国内强制要求做偏见审计吗?
目前在商业招聘场景里还没有强制的偏见审计要求,但合规底线已经存在。《个人信息保护法》第二十四条规定,利用个人信息进行自动化决策,应当保证决策的透明度和结果公平、公正;通过自动化决策方式作出对个人权益有重大影响的决定,个人有权要求说明,并有权拒绝企业仅通过自动化决策的方式作出决定。换句话说,AI 招聘排序必须保留人工干预的通道。叠加《数据安全法》对数据处理的要求,以及《生成式人工智能服务管理暂行办法》明确要求在算法设计、训练数据选择等环节采取有效措施,防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视,合规的边界正在收紧。
AI 是减少还是放大偏见?
两种都可能。用均衡数据训练、配上经过验证的工具(比如大五人格)并做定期审计,AI 会减少偏见。用内部历史数据训练、又不做审计,它会放大偏见。
「文化契合」是不是偏见的伪装?
可能是。当它指「认同公司明确写出来的价值观」(比如一家重视坦诚的公司)时,它是站得住脚的;当它指「在社交上和我像」时,它就有问题。区别就在于书面标准是否清晰。
一句话总结
- 招聘偏见不是品德缺陷,而是人在不确定中做决策时可预见的特性
- 主要的几种:确认、光环、相似性、锚定、可得性、现状,加上地域偏见(国内:地域、学历院校、性别与年龄)以及算法偏见(历史数据、简历优化)
- 降低偏见需要结构化流程、能匿名处就匿名、清晰量表、按人群拆解指标
- AI 会减少也会放大,取决于审计
- NORT 通过预评估池里的客观筛选、可携带的评估和对候选人的透明来发力
想让候选人只测一次,就拿到一份可解释、按技能而非简历打分的结果,从源头上压低偏见吗?免费注册一个 NORT 账号,在你下一次招聘里用客观测评替代第一眼印象。
