gitbook/成为AI产品经理/docs/349632.md

# 31 | AI产品经理面试，这些问题你必须会答！

    你好，我是海丰。

我们在看大厂或者独角兽企业招聘信息的时候，会发现他们最看重两方面：学历和经历。学历一般是看你的学校是不是名校，专业是不是对口。经历一般是看你是否在行业内的知名公司待过，有没有优秀的项目产出。这是我们进入知名互联网公司最基础的敲门砖。

那么，这是不是就意味着，普通院校出身、没有互联网大项目经验的同学就没有机会了呢？其实也不全是，这要靠一点点的“运气”，比如一些独角兽企业一直没有招到合适的人，业务老大急需要干活的人，而你又恰好在面试的时候表现很好，就很可能顺利拿到Offer。

不过，这种“运气”并不常有。因为产品经理入门的门槛比较低，所以很多企业会把招聘的门槛设在学历和经历这些硬性指标上。

看到这儿，你是不是有些气馁？难道我之前付出的努力全都白费了吗？当然不是。相比于传统产品经理，AI产品经理的处境可好太多了。 AI 产品经理有天然的稀缺性，还有专业技术加持，现阶段企业对 AI 产品经理的要求放得比较宽，毕竟目前这方面的人才还是太少了。

因此，如果你想抓住AI产品经理岗位现阶段的红利，顺利拿到Offer、进入大厂，除了要学好我们的专栏，夯实AI技术能力，面试环节也是必须要重视的。这节课，我就带你梳理一下AI产品经理面试的常见问题和应对策略。

面试官在考察候选人之前，事先都会对岗位进行定义，再决定问你哪些问题。虽然产品经理日常大多数情况下都在画原型、写文档，但面试官并不会考察这些，毕竟意义不大。

那么，在 AI 产品经理的面试过程中，面试官会从哪些角度，来观察考察候选人的哪些基本素质呢？接下来，请你把自己代入面试者的角色，和我一起来参加这场面试实战吧！

## 过往经历介绍

首先，欢迎你参加这次面试，请先做个自我介绍吧！说说你在上一家公司主要负责什么，你做过的最有价值的一件事是什么？

这几乎是所有面试的开场白，你一般都是怎么回答的呢？我发现经常会有面试者这么回答：“我做了大量调研工作，写了调研报告，然后画了原型图，最后产出了 PRD文档，经过评审敲定了最终的方案，然后是研发开发，产品上线之后效果还不错。”

类似这样的回答其实没有提供给我有效的信息，因为这样的工作流程不仅和其他人的一样，还没有具体的细节，体现不出来候选人的产品思维和设计能力，甚至还会让面试官感觉你的项目经历是造假的。

那我们该注意些什么呢？**在介绍工作内容的时候，你要注意有逻辑、有数据、有价值。**也就是说你要注意每件事情发生的前因后果，它们之间的逻辑关联，同时追求真实性，不造假。**更重要的是，要更多地展示出自己对工作的认知，在讲流程化工作内容的基础上，提供一些有价值的内容**，比如相关项目的数据表现等等。

下面是我给出的一个示例，你可以参考一下。

我在上一家公司主要负责的是旅游品类产品的设计，做了两个重点的项目，分别是用户留存模型和智慧营销模型。

在用户留存模型的项目中，我先基于现有留存数据和用户行为数据进行定量分析，又基于用户调研和访谈进行定性分析。然后，我对用户流失原因进行了判断，提出可能造成流失的原因，并提出了提升留存的备选方案。接着，我就和算法同学沟通各种方案的落地成本，最后进行了实验，确定各个方案的优先级，最终推进了用户留存模型产品的建设，它的数据表现是这样的……

## 产品行业认知

接下来，请说说你们产品的主要竞品是谁？你认为的行业现状什么样？你对行业未来发展趋势的理解，以及你最喜欢的一款 AI 产品是什么？

这是面试官在考察一个 AI 产品经理除了作为产品功能设计者之外，对所负责产品行业的认知，是否具备一定的行业视野。一个卓越的产品经理一定是能快速讲清楚**自己产品在行业中的份额、竞争力和不足，以及市场现状布局和未来走势**等等。

想要回答好这些问题，你可以参考专栏第一篇章“知己知彼，AI和AI产品经理”里面的内容，别忘了一定要结合自己的行业现状。

## 产品案例问题

接下来，就到了这次面试的第一个小高潮，你做过什么产品案例呢？如果我们最近遇到一个这样的问题，业务方希望我们通过 AI 预测有买花需求的用户，然后给他们发 push，你有什么好的想法吗？

这类产品案例问题一般都是招聘部门真实遇到过的问题，面试官并不会真的预期你能在几分钟给出一个完美的答案，他只是在考察你**分析、拆解问题的能力，以及结构化思维逻辑的能力**。

针对上面的问题，你会给出什么答案呢？如果是我作为面试官，我希望面试者能从项目建设的视角出发，思考和拆解各环节的工作，然后给出每个环节的工作内容、交付物，也就是如下的步骤：

*   产品定义，做这件事情的背景、价值、以及预期目标都是什么；
*   技术预研，判断目前积累的数据和沉淀的算法，是否可以达到我们的业务需求；
*   准备数据，根据模型预研的结果以及公司的实际情况，来帮助算法同学准备数据；
*   模型构建，产品经理协助算法工程师进行模型的构建，并对最终交付的模型进行验收；
*   工程建设，产品经理协调研发团队、算法团队，以及其他第三方的资源依赖，推进需求的产品化落地工作；
*   效果评估，上线后持续对效果进行监控、迭代模型。

基本上，这样的回答就可以让面试官满意了。但如果你是一名高级产品经理，我还建议你可以从业务经验出发，给出一些具有启发性的答案，这会是你的加分项。

## AI 技术问题

最后，面试官会考察你一些 AI 技术问题，这和传统互联网公司的产品经理面试有很大的不同。

目前，人工智能领域的岗位细分还没有成熟，很多企业并不会设立 AI 产品这样的部门，面试官很多都是纯算法或数据出身的人，所以在考察你岗位能力的时候，很自然地就会考察你对技术掌握的深度和广度。

因此，你在准备AI产品经理面试的时候，也要对技术问题有所准备，具体来说就是你要能回答上来，算法工程师或者数据挖掘工程师的初级技术面试题。

面试官经常会问的技术问题有两类，分别是**基础技术问题和算法问题**。基础技术问题可能会问什么是特征清晰、数据变换、训练集、验证集、测试集？什么是过拟合、欠拟合、跨时间测试和回溯测试？机器学习的三大类应用场景是什么？算法类问题可能会问，逻辑回归和线性回归的区别是什么？什么是KNN、聚类分析、决策树模型等等。

## 小结

如果你已经准备参加AI产品经理的面试了，那么我希望你能从 6 方面做好面试的准备，分别是行业知识、项目流程、基础技术、模型评估、经典算法，以及场景案例。我一共准备了20道典型的问题，把它们按照分类总结在了一张思维导图里，你可以利用它先来检测一下你各方面知识的掌握程度。

![](https://static001.geekbang.org/resource/image/3c/9b/3c540cyy3b2a94386c3af7db3f3d429b.jpg)

为了方便你进行验证，我把这些问题的考点、思路和参考答案都梳理在了下面，希望你能好好利用起来。

行业知识问题

问题1：你怎么看待 AI 或者人工智能行业？

考点：考察你对当前人工智能行业发展情况的了解，是否具有预判未来发展趋势和潜在机会的能力。

思路：首先，你需要从全局的角度分析你对 AI 行业现状的理解；其次，最好举一两个当前 AI 的新技术或者新应用来表达你在实时关注这个行业；最后，一定要给出你对这个行业独特的看法。

回答：我认为当前人工智能行业正在逐步从实验室走向工业界。从产业链条上看，AI 主要分为三层，最底层是芯片、云服务等组成的基础支撑层。中间是提供底层 AI 技术的技术层，比如商汤、依图等提供的图像识别技术。上层是应用层，也就是我们最常见的电商搜索推荐，教育行业的 AI 课程。

从应用场景上看，金融、安防、客服是我们目前应用十分广泛的领域。同时，其他行业也在逐步引入 AI 技术。比如好大夫在线，最近就分享了他们如何通过 AI 技术，来进行医学报告单结构化的工作。

在我看来，AI 现在的应用还远远不够，可能 3 年或 5 年之后，AI 必将成为一种基础设施，应用在各行各业，这就有点类似我们 10 年前讨论的移动互联网技术，现在绝大多数行业都离不开移动互联网，移动互联网技术已经成为了行业的基础建设了，那么 AI 大概率也会走上类似的道路。

问题2：对于业务场景，通过 AI 技术可以做哪些工作来提升用户体验？

考点：考察你对于业务场景的理解程度以及 AI 技术边界的了解。

思路：首先你需要问清楚对方的业务场景是什么，他的用户是谁，用户需要通过这个产品解决的问题是什么，然后再考虑目前的AI技术是不是可以有提升点。如果你对对方提供的业务场景不了解，也可以说你们公司或者你了解的某些业务场景，毕竟面试官不是为了套你的方案，而是为了考察你对于 AI 技术边界的了解，和你是不是具有发现需求的能力。

回答：我对您这边的业务还不太了解，不过我之前在一家线上旅游公司工作，我们的模式是直接根据用户搜索结果展示旅游产品列表。但其实我们可以根据每个商品的好评率，对其进行解析，形成一个简单的一句话评论展示在产品列表中，帮助用户进行选择，提高用户点击率。

问题3：现在市场上有哪些竞品公司，有什么优缺点？

考点：同问题 1，考察你人工智能行业发展现状的了解，以及基于你所处业务的同类 AI 竞品公司的分析能力。

思路：首先，你需要从全局的角度分析你对 AI 行业现状的理解；其次，针对你所处的行业来表达你们的产品技术和竞品的产品的定位、受众，以及优劣势等；最后，一定要给出你对所处行业独特的看法。

* * *

项目流程问题

问题4：你们的模型构建流程是怎么样的？

考点：考察你对 AI 项目构建过程的熟悉程度，类似于传统产品经理建设研发项目的过程。

思路：先回答 AI 项目从筹备到上线的全过程，比如分几个阶段，每一个阶段都有什么角色参与，每个角色需要做什么工作，他们的产出又都是什么。然后再回答 AI 产品经理的完整工作流程是什么，需要参与哪些阶段和具体的工作。

回答：具体的回答，你可以参考第 05 讲。

问题5：AI 产品经理和传统产品经理的区别是什么？

考点：考察候选人除了对通用的产品能力理解之外，是否熟悉 AI 行业、产业结构，是否了解实现目标的技术手段、算法等等。

回答：具体的回答你可以参考第 02 讲。

* * *

基础技术问题

问题6：什么是特征清洗、数据变换？

回答：数据清洗就是对数据进行清洗，去掉重复值、干扰数据，以及填充缺失值。

数据变换就是将数据处理成方便模型使用的数据形式。比如我们需要使用用户的身高作为模型特征，但是有的数据是用厘米作单位，有的数据会使用米作单位。这个时候，我们就需要使用归一化，把数据的单位统一成米或者厘米。归一化也是数据变换最主要的手段。

问题7：什么是训练集、验证集和测试集？
回答：训练集是让机器学习的样本集合，用来拟合模型。验证集是模型训练过程中，用来对模型性能做初步的评估，用于模型参数调优。测试集是最终用来评估模型效果的。

问题8：什么是过拟合和欠拟合？

欠拟合就是偏差较大，指的是模型的预测结果和实际结果的偏差比较大，说白了就是模型预测不准。造成欠拟合的原因可能是特征少或者模型训练不足。过拟合就是方差偏大，指的是模型在一部分数据上表现好，在另一部分数据上表现差。造成过拟合的原因可能是特征过多而训练集不够。

问题9：什么是跨时间测试和回溯测试？

回答：跨时间测试也叫 OOT 测试，是测量模型在时间上的稳定性。回溯测试是用过去一段时间的真实数据构造出一个模拟的环境（回溯环境），让模型在历史的那段环境中运行，得到历史某个时间点的模型结果。

一般来说，跨时间测试是在模型上线之前就应该要做的事情。回溯测试是指模型已经存在并已经上线了，想要看模型在历史某个时间点的数据表现时候，进行的测试。

问题10：机器学习的三大类应用场景都是什么？

回答：三大类应用场景分别是分类问题、回归问题、聚类问题。

分类问题又可以分解成二分类问题和多分类问题。二分类问题的预测结果只有两个离散的值，如“是/否”"1/0"。多分类问题的预测结果是多个离散的值，如“A、B、 C”。

回归问题的预测的结果是连续的值，如房价的预测、库存的预测。聚类问题是无监督学习，将相似的样本归类在一起，如细分客户、新闻聚类。

* * *

模型评估问题

问题11：你怎么评估模型的好坏？

考点：考察你模型评估指标的掌握程度，回答时要说明模型评估的三个部分：统计性、模型性能和模型稳定性。

回答：模型评估的好坏可以通过模型评估指标进行衡量，模型评估指标包括三部分，分别是统计性指标、模型性能指标和模型稳定性指标。

统计性指标指的就是模型输出结果的覆盖度、最大值、最小值、人群分布等指标。

模型的性能评价指标主要包括混淆矩阵、KS、AUC 等等。通过混淆矩阵，我们就可以得到一个模型的精确率、召回率这些指标，从而可以评估一个模型的区分能力，也可以计算得到TPR、FPR，从而计算出AUC、KS等相关指标。

回归模型的性能评价指标主要包括MAE（平均绝对误差）、MSE（均方误差）、RMSE（均方根误差）、R 方等。

模型的稳定性即判断模型输出结果，是否会随着时间推移而发生较大变化不再稳定的指标，主要使用PSI进行评估。

问题12：什么是 ROC 曲线？

回答：ROC 曲线是分类算法模型的一种评价标准，ROC 曲线的横坐标为假阳性率 FPR、纵坐标为真阳性率 TPR，计算公式为 FPR = FP / N，TRP = TP / P，其中 P 是真实的正样本数量， N 是真实的负样本数量，TP 是 P 个正样本中被分类器预测为正样本的个数，FP 是 N 个负样本中被分类器预测为负样本的个数。

以一个医院诊断病人为例，假设有 10 位疑似感染患者，其中 3 位很不幸诊断阳性（P = 3），另外 7 位诊断阴性（N = 7），对于诊断阳性的 3 位患者，其中有 2 位确实是真正的患者（TP = 2）。那么真阳性率 TPR = TP / P = 2/3，对于 7 位诊断阴性的患病者来说，也很不幸误诊了一位患者（FP = 1），那么假阴性率 FPR = FP / N = 1/7。

对于分类器来说，这组分类结果就对应 ROC 曲线上的一个点 (1/7, 2/3)，最后，由分类器计算出来的多个点组成 ROC 曲线。

问题13：什么是 AUC ？

回答：AUC 指的是 ROC 曲线下的面积大小，它能够量化地反映出基于 ROC 曲线的模型性能，AUC 的取值一般在 0.5 ~ 1 之间，AUC 越大，说明分类器性能越好。

* * *

经典算法问题

问题14：逻辑回归相比于线性回归，有什么区别？

考点：考察候选人对于线性回归和逻辑回归的理解。

回答：首先，它们最主要的区别是：逻辑回归解决的是分类问题，预测属于某类的概率；线性回归解决的是回归问题，预测一个连续变量(如降水量，价格等)。

线性回归使用的是最小化平方误差损失函数，对偏离真实值越远的数据惩罚越严重，容易受到异常值影响。逻辑回归是一种减小预测范围的函数，它将预测值限定为\[0,1\]间，不容易受到异常值的影响。

问题15：你能介绍一下 KNN 的原理吗？

回答：KNN 核心原理可以理解为“近朱者赤近墨者黑”，即基于距离的一个简单分类算法。在数据量不多，并且特征都相对单一的业务场景下，很适合选择 KNN 算法（详细内容见 09 讲）。

问题16：你能介绍一下聚类分析吗？

回答：聚类分析属于无监督算法，是按照个体的特征将数据分类，让同一个类别内的个体之间具有较高的相似度，不同类别之间具有较大的差异性。

K-means 算法是机器学习领域中处理无监督学习最流行、经典的聚类分析方法之一。它是典型的基于距离的聚类算法，采用距离作为相似性的评价指标，待测样本点距离聚类中心的距离越近，它的相似度就越大（详细内容见第 15 讲） 。

问题17：你能介绍一下决策树模型吗？

回答：随机森林的原理可以理解为“三个臭皮匠赛过诸葛亮”，特点是具有树形结构，可解释性强，直观好理解，而且还可以从结果向上去追溯原因。采用决策树可以更方便地向老板、业务方，或者甲方去解释模型是什么。

比如在金融风控场景下，我们经常通过决策树判断用户的违约风险。决策树在预测用户违约案例上的核心思想是，先获取部分用户的历史数据，历史数据包括过去的信贷数据和还款结果，然后将贷款客户不断进行分类，直到某个节点的样本用户都是同一个类型为止。最后，再对决策树进行剪枝，简化树的复杂度（详细内容见 13 讲）。

* * *

场景案例问题

问题18：请举例说明如何设计一个推荐类的产品。

考点：考察候选人对推荐类产品的召回、排序、调整各阶段的理解。在回答推荐类产品设计问题时，要明确每个阶段的基本策略和工作内容，最好还要了解相关经典算法或模型，比如召回阶段的协同过滤，以及排序阶段的 CTR 预估（详细内容见第 23 讲）。

问题19：请举例说明如何设计一个预测类的产品。

考点：考察候选人对于预测类产品场景化的落地经验。

思路：首先，根据应用场景不同，这类需求可以分为分类任务和回归任务，比如用户复购模型预测就是分类任务，而酒店价格预测就是回归任务。

其次就是产品经理要站在业务场景下，阐述推进 AI 产品建设的全过程，从数据准备到模型构建，再到模型验收，以及部署上线，各环节产品经理需要参与的工作，以及工作内容和评价标准（详细内容见第 27 讲）。

问题20：请举例说明如何设计一个自然语言类的产品。

考点：考察候选人对于 NLP 的理解，这个问题面试官会基于具体的场景来考察候选人，比如，如何设计一个对用户评论分析挖掘的产品。

如果是基于这样的场景提问，候选人要先说明 NLP 能做什么，然后再回答其中涉及的具体工作，比如评论挖掘就会涉及用户情感分析、用户标签挖掘、用户评论相似度分析，以及评分质量打分等等（详细内容见第 29 讲）。

## 课后讨论

如果你真的参加了一场 AI 产品经理的面试，你觉得自己的核心竞争力是什么？

期待在留言区看到你的故事，我们下节课见！