- 面试开场与规则(建议 25–35 分钟)
隐性评分的 5 个目标
1 做过真项目还是停在概念/Demo
2 是否能从业务问题出发理解 AI
3 是否理解 AI 是系统工程,而不是单点模型
4 是否具备工程型岗位的成长潜力
5 是否值得占用一次昂贵的技术面名额
建议评分方式每个维度 0–4 分,总分 24 分。
• 0:空泛,无法落到真实场景与细节
• 1:做过一点,但参与浅、讲不清边界与取舍
• 2:做过项目,能讲过程,但缺系统性与复盘
• 3:能讲清业务目标、工程方案、权衡与结果,有证据感
• 4:有负责人视角,讲得出机制化方法(评估、治理、迭代),可带团队演进
维度一:岗位动机与角色认知
1维度目标
判断候选人是否清楚 AI 应用开发岗的真实工作形态(需求、数据、工程、上线、运营),动机是否稳定且与岗位匹配,是否有”从交付到负责”的成长意愿。
2主问题
你为什么想做 AI 应用开发?你希望在这个岗位上解决什么问题、承担什么角色?
3深挖追问
• 你最理想的工作产出是什么?是模型效果、功能上线、还是业务指标?为什么?
• 你过去最享受的一次交付是什么?如果让我问你”你在里面到底负责啥”,你会怎么说?
• 如果入职 3 个月发现大量时间在做数据清洗、评估、打磨产品细节,而不是”调模型”,你能接受吗?你会怎么安排优先级?
4风险信号
• 动机停留在”风口/好找工作/喜欢大模型很酷”,没有岗位现实感
• 把工作理解为”接个 API 写个聊天框”,对落地成本与工程链路无感
• 说不清”自己想成为什么样的人”(工程交付者、Owner、架构方向等)
• 对脏活累活(数据、评估、上线后维护)明显排斥
5高质量口语化回答示例
我想做 AI 应用开发是因为我更擅长把能力变成可交付的产品,而不是停留在”模型好不好看”。我做项目时最看重的是:能不能真的上线、能不能稳定跑、能不能让业务愿意持续用。我对这个岗位的理解是,它更像”AI 产品工程负责人”的路径:从业务目标出发,把数据、检索、工具调用、权限、成本、监控这些串起来,最后对效果和体验负责。如果入职后大量工作在数据清理、评估、提示词迭代、灰度和运维,我是接受的,因为这些决定了系统能不能长期稳定。我的目标不是把 Demo 做出来,而是把可运营的系统交付出去,并且能持续迭代。维度二:AI 项目真实性与参与深度
1维度目标
验证”真做过”而非”看过/抄过/拼过”。重点看:是否讲得出项目背景、约束、关键决策、上线链路、问题与复盘;是否能明确自己的贡献边界。
2主问题
挑一个你最能代表你能力的 AI 应用项目,按”背景-目标-你做了什么-结果”讲清楚。不要讲技术名词堆砌,我想听你怎么把它做成的。
3深挖追问
• 这个项目如果没有你,会卡在哪里?你解决的”最关键的一个卡点”是什么?
• 你们怎么验收的?谁说了算?上线后怎么判断”真的有效”?
• 项目里最难的一次事故/翻车是什么?你怎么定位、怎么止损、怎么复盘避免再发生?
• 你做了哪些”文档/机制”让项目能交接、可维护?(比如评估报告、上线 checklist、监控告警规则、回滚预案)
4风险信号
• 只讲”用了什么框架/模型”,讲不出业务目标、约束、验收方式
• 说不清自己负责的边界,一追问就”我们团队做的”
• 没有失败案例或复盘,或者把失败全甩给”模型不行/数据不行”
• 上线链路含糊:没有灰度、没有监控、没有回滚、没有成本意识
5高质量口语化回答示例(60–90 秒)
我讲一个内部知识问答项目。背景是客服和售后同事每天被重复问题打断,知识散在文档、群消息和工单里,回答质量不一致。目标不是”做个聊天机器人”,而是把高频问题的处理时间降下来,并且回答要可追溯。我负责的是从 0 到 1 的落地链路:先把业务问题拆成”检索命中率、回答准确性、可追溯”三个验收点;再把数据源统一到一个可维护的知识库,定义更新流程;最后把线上流程做成可观测的:每次回答都能看到引用来源、命中情况和用户反馈。上线后我们用两周做灰度,核心结果是高频问题的平均处理时间明显下降,同时我也把失败案例沉淀成”不可回答就转人工”的规则,避免模型瞎编带来风险。维度三:业务理解与问题抽象能力
1维度目标
看候选人是否能把”业务痛点”转成”可实现、可验收、可迭代”的问题定义;是否懂指标、懂角色、懂流程;是否能区分”要不要用 AI”以及”用 AI 解决哪一段”。
2主问题
你做项目时,业务方往往会说”我们想要一个 AI 助手”。你通常怎么把这个需求拆清楚?你会先问哪些问题?
3深挖追问
• 你怎么定义成功?是节省时间、提升转化、降低错误率,还是提升满意度?哪个最关键,为什么?
• 你如何判断”这事不该用大模型”,或者”先不用 Agent”?你给过业务方否定意见吗?
• 你怎么处理业务方”既要又要还要”的需求?你怎么做 MVP 和迭代路线?
4风险信号
• 把业务理解等同于”写提示词让模型回答更像人”
• 讲不出业务角色、流程节点、边界条件、验收指标
• 不敢说”不”,一味迎合业务,缺少产品与工程判断
• 只讲功能,不讲成本、风险与组织协作
5高质量口语化回答示例(60–90 秒)
业务说”要一个 AI 助手”时,我通常先把它拉回到三个问题:第一,你最想减少哪类成本,是时间、错误还是人力?第二,谁在什么场景用,它接在流程的哪一步?第三,失败了怎么办,能不能接受不确定性。 我会把需求拆成可验收的东西,比如”Top50 高频问题命中率””回答可追溯比例””需要人工兜底的触发条件”。如果发现数据不稳定、风险高,或者流程本身没理清,我会建议先做”检索+标准答案推荐”而不是一步到位做全自动。 我的习惯是用 MVP 先验证一段闭环:让业务先用起来,收反馈,再逐步增加自动化程度和覆盖面,而不是一上来追求”全能助手”。维度四:工程意识与系统思维(核心维度)
1维度目标
确认候选人是否真正理解 AI 应用落地的工程复杂度:数据链路、评估、稳定性、成本、权限、安全、可观测、灰度与回滚;是否具备系统化思维而非”拼模型”。
2主问题
你认为一个 AI 应用从”能跑”到”能上线长期用”,中间最大的差别是什么?你会优先补哪三件事?
3深挖追问
• 你怎么做”效果评估”与”线上反馈闭环”?如果业务说”感觉还行”,你怎么把它变成可量化?
• 你如何控制成本与延迟?当并发上来后你会怎么处理?
• 你们怎么做可观测?至少要能回答哪些线上问题?(例如:为什么这次回答错了、引用了什么、耗时在哪里、失败率多少)
• 如果模型输出出现”胡编”或越权信息,你设计过什么兜底机制?
4风险信号
• 把”上线”理解为”部署一下服务”,对监控、灰度、回滚、权限、成本没有概念
• 一谈不确定性就回避:只会说”多调参/换大模型”
• 缺少工程妥协意识:想要完美,不会做边界与兜底
• 对安全合规无感:不考虑数据权限、日志留痕、敏感信息
5高质量口语化回答示例(60–90 秒)
我觉得”能跑”和”能长期上线”差别不在模型,而在系统是否可控。AI 有不确定性,所以必须把它关进可治理的流程里。我通常会优先补三件事:第一是评估与反馈闭环,至少要有可量化的指标和样本集,不然迭代没方向;第二是可观测和兜底机制,线上要能追溯每次回答用了什么依据,失败了能降级到规则或人工;第三是成本与稳定性控制,比如并发上来后的限流、缓存、队列化,以及对高成本请求做分层处理。我不追求”永远正确”,我追求”错得可控、可解释、可快速修复”,这样系统才敢放到真实业务里用。
主问题很多 LLM 的部署和应用流程网上都能查到,听起来大家都差不多。那你到底有什么优势和价值?你有什么创新?
深挖追问
• 你说的”优势”能举一个你亲手做过的例子吗?没有例子我不太敢信。
• 你所谓”创新”是技术炫技,还是让业务更稳定、更省钱、更可控?你怎么证明?
• 如果我们给你同样的模型和同样的流程,你怎么做到比别人交付质量更高?
高质量口语化回答示例(60–90 秒)我同意基础流程大家都能查到,但真正拉开差距的是把流程做成”可复制的交付能力”。我的优势不在于知道步骤,而在于知道哪些地方会翻车、怎么提前把风险压下去。举个例子,在一个知识问答项目里,大家一开始都能把检索和生成跑起来,但上线后最大的问题是”错误不可控、业务不敢用”。我做的关键改进不是换模型,而是把回答变成”可追溯、可拒答、可回滚”:每次输出必须带来源依据;命中不足就触发拒答或转人工;同时把失败样本沉淀成评估集,形成周更的迭代节奏。所谓创新,对我来说不是花哨功能,而是把 AI 变成可治理的系统能力,让它在真实业务里稳定、省钱、可控地跑起来。
维度五:学习方式与成长路径
1维度目标
判断候选人是否具备持续学习与工程化成长的能力:能否形成自己的方法论、能否复盘、能否把学习转化为可交付产出;是否具备向 Owner/架构方向成长的迹象。
2主问题
过去 6 个月你学得最有用的一件事是什么?你是怎么学的,最后怎么用到项目里?
3深挖追问
• 你遇到不确定问题时,怎么验证假设?你会怎么做小实验或对比?
• 你有没有做过复盘沉淀?沉淀成了什么(文档、规范、模板、指标、组件)?
• 你如何跟上变化很快的 LLM 生态,但又不被”新工具焦虑”带跑偏?
4风险信号
• 学习方式只剩”刷教程、看博主”,没有产出与验证
• 没有复盘沉淀意识,知识停留在个人脑子里
• 对新东西盲目崇拜,缺少选择标准
• 只谈”学了什么技术”,不谈”解决了什么问题”
5高质量口语化回答示例
我最近半年最有用的学习是把”效果问题”拆成可验证的链路,而不是靠感觉调。我的学习方法一般是:先用真实业务样本定义评估集和指标,然后做最小对比实验,明确提升来自哪里。我不追热点式学习,更多是带着项目问题去学,比如线上延迟高、回答不稳定,我就会去补并发、缓存、降级和可观测相关的实践。学完以后会沉淀成团队能复用的东西,比如上线 checklist、评估模板、失败样本归档流程,这样下一次同类项目能更快更稳。我希望自己的成长路径是从交付工程师到模块负责人,再到能对系统架构和治理负责的人。维度六:表达能力与风险意识
1维度目标
评估候选人的表达是否结构化、可信、有证据感;是否具备风险意识(安全、合规、错误成本、组织协作);是否能在压力追问下保持一致性与清晰度。
2主问题
你能用 1 分钟解释清楚你做过的一个 AI 项目,让一个非技术的业务负责人也听懂并愿意继续投入吗?
3深挖追问
• 你怎么处理”模型说错了导致业务损失”的责任边界?你提前怎么设计?
• 你有没有遇到过跨部门扯皮?你怎么推动落地?
• 你怎么看待数据合规与权限?在项目里你做过哪些约束?
4风险信号
• 表达散、跳跃、全是名词,听不出逻辑主线
• 遇到追问前后矛盾,可信度下降
• 风险意识弱:对越权、泄露、胡编、审计留痕不敏感
• 把问题归因给外部,不承担、不复盘
5高质量口语化回答示例(60–90 秒)
我会用业务能听懂的方式说:这个项目不是做”会聊天的 AI”,而是把某一类重复工作变成半自动或自动,并且保证出错可控。我们先选了最有价值、最标准化的一段流程做试点,用明确的指标验收,比如处理时长、错误率、需要人工介入比例。风险上我一直强调两点:第一,AI 的输出必须可追溯,不能给出没有依据的结论;第二,必须有兜底机制,遇到低置信或敏感内容就降级到人工或规则。我做项目时会把这些要求写进交付标准和上线流程里,这样业务方用得安心,团队也能持续迭代,而不是靠个人英雄主义撑着。
一、能力维度 1:岗位动机与角色认知
1维度目标(HR 内部视角)
判断候选人是否:
• 对 AI 应用岗位有清晰认知
• 离职原因是否理性、可控、非情绪化
• 职业规划是否现实且可落地
• 是否存在频繁跳槽或方向摇摆风险
2主问题(HR 会怎么问)
你先说说,为什么会考虑离开上一家公司?
3深挖追问
• 你当时有没有尝试在原公司内部调整方向?
• 如果从现在回头看,你觉得前公司最大的优点和局限分别是什么?
• 你希望下一家公司,和上一家最核心的不同点是什么?
4风险信号(HR 红旗)
• 把离职原因全部归结为:领导、同事、环境
• 评价前公司只有情绪,没有结构
• 职业规划停留在「想更深入」「想提升自己」
5高质量口语化回答示例(60–90 秒)
核心还是方向匹配的问题。在上一家公司,我参与了一些 AI 相关的工作,但整体更多偏向局部优化和支持性角色,而不是完整的应用闭环。公司本身很稳,流程也成熟,这是优点,但对我来说,试错空间和成长速度有限。我有和主管沟通过是否能承担更多 AI 应用相关的职责,但现实条件不太支持,所以才开始系统性地看机会。未来 2–3 年,我希望自己能在 AI 应用层面形成可复用的能力,而不是只做某一个点。
二、能力维度 2:AI 项目真实性与参与深度
1维度目标
判断候选人是否:
• 真的参与过 AI 应用项目
• 在项目中承担过有判断力的角色
• 能说清楚自己的不可替代价值
2主问题
你过往做过的 AI 项目里,你最核心的贡献是什么?
3深挖追问
• 如果你不在,这个项目最可能卡在哪里?
• 哪一部分是你自己判断和推动的,而不是被分配的?
• 现在回看,你觉得当时哪一步最容易出问题?
4风险信号
• 描述项目只停留在”我们做了什么”
• 把价值等同于”用过哪些技术”
• 无法说清失败点或妥协点
5高质量回答示例
我的优势不在于某个模型本身,而是在把问题拆清楚。
比如在某个项目里,最开始大家都在纠结模型效果,但我发现真正影响结果的是数据边界和使用方式。
我当时推动把问题拆成两个阶段:先保证稳定可用,再追求效果提升。
这让项目能先跑起来,而不是一直停留在优化阶段。
三、能力维度 3:业务理解与问题抽象能力
1维度目标
判断候选人是否:
• 从业务目标而非技术出发
• 能解释「为什么这样做」
• 理解 AI 应用的商业价值边界
2主问题
你怎么理解 AI 应用开发这个岗位,和纯技术岗位的区别?
3深挖追问
• 如果业务方对 AI 预期过高,你通常怎么处理?
• 你做过哪些主动帮业务降预期或改方案的情况?
4风险信号
• 把 AI 当”魔法”
• 一味强调能力,不谈约束
• 避谈失败和不确定性
5高质量回答示例
我理解 AI 应用开发更像是一个系统工程角色。它不是把模型接上就结束,而是要考虑业务流程、失败兜底、效果评估和长期维护。我能胜任这个岗位,是因为我不太容易被”模型效果”带偏,更关注是否真的解决了问题。这在很多项目里,其实比技术本身更关键。
四、能力维度 4:工程意识与系统思维
1维度目标
判断候选人是否:
• 具备工程负责人潜质
• 理解协作与分工
• 不以”个人英雄主义”为中心
2主问题
如果让你负责一个 AI 应用小团队,你会从哪几件事开始?
3深挖追问
• 你会优先招什么样的人?
• 技术债和进度冲突时,你怎么取舍?
4风险信号
• 一切围绕自己
• 忽略非技术角色
• 不考虑长期维护
5高质量回答示例
我会先明确目标和边界,而不是先堆人。团队里一定要有人能对业务负责,有人能对工程稳定性负责。初期我会尽量让系统简单可控,避免一开始就复杂化。因为 AI 项目最怕的是跑不起来,而不是不够先进。
五、能力维度 5:学习方式与成长路径
1维度目标
判断候选人是否:
• 对自己有清醒认知
• 有可改进的短板
• 不自我包装
2主问题
你觉得自己目前最大的不足是什么?
3深挖追问
• 你是怎么意识到这个问题的?
• 最近一年你做了哪些调整?
4风险信号
• 把缺点包装成优点
• 空泛自省
• 无改进动作
5高质量回答示例
我之前有一个问题是对结果要求过高,容易在细节上投入过多时间。后来我意识到在 AI 项目中,”阶段性可用”比”一次做到最好”更重要。现在我会更刻意控制节奏,把精力放在关键决策点上。
六、能力维度 6:表达能力与风险意识
1维度目标
判断候选人是否:
• 抗压但不极端
• 具备团队适配能力
• 沟通方式成熟
2主问题
你怎么看待工作时间和工作强度?
3深挖追问
• 高强度持续一段时间,你怎么自我调节?
• 新团队中你通常如何建立信任?
4风险信号
• 绝对化立场
• 情绪化表达
• 抵触沟通
5高质量回答示例
我能接受在关键阶段有强度,但更看重是否有明确目标和节奏。融入团队上,我通常会先理解现有做法,而不是急着改变。通过把事情做好、沟通清楚,信任会自然建立。