招聘偏见:最常见的11种类型

NORT|2026年5月16日·10 分钟阅读

四位不同族裔的职场人士围坐在会议桌旁

招聘偏见不是招聘者的品德缺陷,而是人脑和算法系统在不确定中做决策时一种可以预见的特性。否认它存在并不能减少它,只会让它继续在看不见的地方起作用。

这篇文章是一份实用清单:当下国内招聘决策里最常见的11种偏见,每一种在漏斗里具体怎样显现,以及哪些做法能压低它的影响。它不承诺消除偏见,只承诺给出诊断和工具。

经典的人为偏见有哪些

1. 确认偏见

招聘者在面试的头30秒(或者第一眼扫过简历时)就形成了一个印象,接下来的整场对话都在为这个印象找证据。提问变成了为最初那个假设寻找佐证。

怎样显现: 候选人「过」初筛,往往是因为开场让人觉得舒服;「没过」往往是因为早早制造了某种别扭。

怎样降低:

  • 用结构化面试,对所有人问同一套问题
  • 在和同事讨论之前先写下书面判断
  • 用封闭式评分量表,而不是「我觉得他表现挺好」

2. 光环效应(与犄角效应)

某个特别突出的正面(或负面)特征,会扩散到整个评价上。名校出身的候选人会被认为在所有维度都更强,沟通、推理、担当,哪怕没有任何证据。

怎样显现: 「他是清华的,分布式系统肯定厉害。」或者:「他简历上有18个月的空窗期,整个人大概都比较散漫。」

怎样降低:

  • 分维度评估,每一维用独立量表
  • 不要汇总成一个「整体印象」
  • 技术测试匿名化(去掉姓名、去掉院校)

3. 相似性偏见

倾向于偏爱和招聘者相像的候选人(相同的社会背景、同一所学校、同样的爱好、相近的性格)。这是最难根除的偏见,因为它常常被包装成「投缘」或「文化契合」。

怎样显现: 「我觉得他这人挺对路,和我们能合得来。」这句话很多时候的意思是「他和我很像」。

怎样降低:

  • 组建背景多元的面试小组
  • 把「文化契合」(认同公司明确写出的价值观)和「社交契合」(和我像)区分开
  • 在面试之前用书面标准把「文化契合」定义清楚

4. 锚定偏见

第一个数字或第一条信息会框住后面的所有判断。先看到的那份漂亮简历,会成为接下来20份简历的参照锚点。

怎样显现: 「这是这批里最好的」,通常指的是最接近第一份的那个。

怎样降低:

  • 拿候选人对照评分量表,而不是互相对照
  • 随机打乱评估顺序
  • 每批评估之间留出间隔,重置锚点

5. 可得性偏见

我们会根据例子有多容易想起来,去估计概率。如果上一个不靠谱的开发是写 Vue 的,那么写 Vue 的候选人就显得有风险,哪怕没有数据支撑。

怎样显现: 「用某某框架的开发往往架构能力弱」,这个观点基于两三个个案,而不是统计。

怎样降低:

  • 有汇总数据时,依据数据下判断
  • 把团队内部的经验法则写下来,定期复盘
  • 在能用客观测试的地方,用测试替代直觉

6. 现状偏见

无意识地偏爱和现有团队成员相像的候选人。它会主动削弱多元性,哪怕公司口头上说自己重视多元。

怎样显现: 整个团队都是男性、都来自头部院校、都做 Java 后端。下一个「合得来」的录用大概率还是同一种画像。「我们不是故意的」,恰恰是这种偏见之所以危险的地方。

怎样降低:

  • 在开岗位之前先做一次有意识的差距分析(「我们团队还缺什么」)
  • 从源头上让人才管道更多元(不只在那几个显而易见的渠道发岗位)
  • 录用后按人群维度跟踪指标,每季度复盘

国内特有的偏见

7. 地域偏见

在国内,地域带来的隐性印象很强。一线和新一线城市(北上广深、杭州)的简历,往往比下沉城市或欠发达地区的简历得到更多注意,哪怕岗位本身是远程的。籍贯、户籍、第一份工作的城市,都会被悄悄读成某种「成色」。

怎样降低:

  • 第一遍阅读匿名化(去掉籍贯、去掉城市、去掉户籍信息)
  • 让候选人池在地域上更分散
  • 按地域统计通过率,定期复盘

8. 学历与院校偏见

「985/211」「双一流」在第一遍筛选里被赋予了过高的权重。普通本科、专升本、民办院校出身的候选人,即便实际表现相当,也在竞争中处于劣势。第一学历歧视在国内尤其顽固,常常以「硬性门槛」的名义出现。

怎样降低:

  • 把技术测试放在面试之前,且不暴露院校信息
  • 按实测技能下判断,而不是按学校名气

9. 性别与年龄偏见

在技术岗位上格外顽固。署名男性的简历更容易被读成「技术能力强」,署名女性的简历更容易被读成「软技能好」。年龄上,「35岁门槛」是国内独有且被广泛默认的现象,许多岗位在筛选阶段就默默把年长候选人过滤掉了。这些都不是理论,而是被反复观察到的现实。

怎样降低:

  • 第一遍筛选匿名化(去掉姓名、去掉照片、去掉年龄)
  • 面试小组里有女性参与
  • 把标准化的技术测试放在行为面试之前

算法偏见有哪些

10. 历史数据继承来的偏见

用过往招聘数据训练的 AI 模型,会学到其中的模式,包括那些你并不想复制的模式。著名案例:亚马逊(2018年)用十年招聘历史训练简历筛选模型,结果发现它会给含有「女子」字样的简历降分,模型随即被下线。在国内,Moka、北森这类招聘与测评平台,以及 BOSS直聘、智联招聘上的智能匹配,本质上跑的都是从历史数据里学规律的同一套逻辑,同样会继承数据里的偏见。

怎样显现: 一套 AI 筛选平台「莫名其妙」地比起 Y 人群,过滤掉了更多 X 人群的候选人。这不是被显式写进代码的,而是继承来的。

怎样降低:

  • 对模型做偏见审计,用覆盖不同人群的合成样本测试
  • 每年用更均衡的数据集重新评估
  • 留存人工干预环节,让自动化排序的结果可解释、可申诉

11. 「简历优化」带来的偏见

那些靠关键词匹配打分的系统,会偏向学会了「为机器优化简历」的候选人,而不是技术上最强的人。这制造了一种次生偏见,专门误伤那些把简历写得简洁直接的人。

怎样降低:

  • 把筛选环节从「读简历」挪到「测技能」
  • 像 NORT 这样的平台,靠基于测试而非简历的职业评分,正面打击这种次生偏见

怎样判断自己有没有偏见(以及有多大)

光声明善意是不够的。四个可以落地的检验:

检验1:按人群拆解

按性别、年龄、院校等维度,比较每一阶段的通过率。如果某个群体在第二阶段到第三阶段之间的通过率掉得更厉害,说明偏见正在那个阶段起作用。

检验2:审查岗位描述

岗位 JD 里有没有带性别暗示的词(比如把岗位写得「能扛」「能拼」「狼性」,在国内语境里偏向男性化)?把这类措辞替换成对能力的客观要求。

检验3:受控的匿名评估

对同一批简历,分别用「带身份信息」和「不带身份信息」(姓名、照片、院校、籍贯)两种方式套用同一套评分量表。结果不一致,就是偏见存在的直接证据。

检验4:最终候选池的多元度

如果排名前10%的候选人是 X 画像,而最终录用的前10%是另一种画像,那么偏见住在漏斗里,而不在候选池里。

哪些做法听起来不错,却减不了偏见

  • 只搞「无意识偏见培训」却不改流程:近期研究显示它只有短期效果,行为上不会持续改变
  • 只喊口号定比例,却不改评价标准:制造反感,却没解决根因
  • 只谈「归属感文化」却没有数据:没有度量的口号改变不了任何事
  • 把 AI 当成人为偏见的自动解药:很可能只是用一种算法偏见换掉了一种人为偏见

NORT 在这件事上怎么发力

需要先说清楚一点:NORT 不是招聘管理系统(ATS)。ATS 管理的是申请流程和漏斗;NORT 做的是反向招聘加候选人测评,它和 ATS 互补,而不是取而代之。想了解漏斗本身怎么管理、又在哪里触及边界,可以读一读术语表里的招聘管理系统(ATS)

在这个前提下,NORT 通过三个机制对付偏见:

1. 在预评估的候选池里按客观标准筛选:按实测技能、实测语言、经过验证的大五人格打分。简历退居次要。

2. 可携带的评估:候选人只做一次流程;企业在第一遍阅读时,没有按姓名、照片、院校筛选的机会。

3. 对候选人透明:结果对候选人本人可见,所以自动化决策是可被问责的。

它不会消除所有人为偏见(最终面试依然存在),但它把漏斗的瓶颈挪到了更经得起检验的地方,也就是技能的度量。

常见问题

偏见能彻底消除吗?

不能。但可以显著降低。研究显示,结构化流程加上首轮匿名评估加上清晰量表,能在多个人群维度上把偏见降低30%到60%。彻底消除需要拿掉人的决策,那又会带来别的问题。

企业按比例招人在法律上可行吗?

在国内,针对欠发达地区、残障人士、退役军人等群体的就业帮扶与定向招聘,有明确的政策依据,是被鼓励的。这和「按人群挑选某个候选人」不同,它是「面向特定群体开放岗位」。同时要注意,《就业促进法》明确禁止基于民族、性别、宗教等的就业歧视,企业在设置标准时需要守住这条底线。

国内强制要求做偏见审计吗?

目前在商业招聘场景里还没有强制的偏见审计要求,但合规底线已经存在。《个人信息保护法》第二十四条规定,利用个人信息进行自动化决策,应当保证决策的透明度和结果公平、公正;通过自动化决策方式作出对个人权益有重大影响的决定,个人有权要求说明,并有权拒绝企业仅通过自动化决策的方式作出决定。换句话说,AI 招聘排序必须保留人工干预的通道。叠加《数据安全法》对数据处理的要求,以及《生成式人工智能服务管理暂行办法》明确要求在算法设计、训练数据选择等环节采取有效措施,防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视,合规的边界正在收紧。

AI 是减少还是放大偏见?

两种都可能。用均衡数据训练、配上经过验证的工具(比如大五人格)并做定期审计,AI 会减少偏见。用内部历史数据训练、又不做审计,它会放大偏见。

「文化契合」是不是偏见的伪装?

可能是。当它指「认同公司明确写出来的价值观」(比如一家重视坦诚的公司)时,它是站得住脚的;当它指「在社交上和我像」时,它就有问题。区别就在于书面标准是否清晰。

一句话总结

  • 招聘偏见不是品德缺陷,而是人在不确定中做决策时可预见的特性
  • 主要的几种:确认、光环、相似性、锚定、可得性、现状,加上地域偏见(国内:地域、学历院校、性别与年龄)以及算法偏见(历史数据、简历优化)
  • 降低偏见需要结构化流程、能匿名处就匿名、清晰量表、按人群拆解指标
  • AI 会减少也会放大,取决于审计
  • NORT 通过预评估池里的客观筛选、可携带的评估和对候选人的透明来发力

想让候选人只测一次,就拿到一份可解释、按技能而非简历打分的结果,从源头上压低偏见吗?免费注册一个 NORT 账号,在你下一次招聘里用客观测评替代第一眼印象。

继续探索
返回博客