You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

240 lines
20 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 31 | AI产品经理面试这些问题你必须会答
你好,我是海丰。
我们在看大厂或者独角兽企业招聘信息的时候,会发现他们最看重两方面:学历和经历。学历一般是看你的学校是不是名校,专业是不是对口。经历一般是看你是否在行业内的知名公司待过,有没有优秀的项目产出。这是我们进入知名互联网公司最基础的敲门砖。
那么这是不是就意味着普通院校出身、没有互联网大项目经验的同学就没有机会了呢其实也不全是这要靠一点点的“运气”比如一些独角兽企业一直没有招到合适的人业务老大急需要干活的人而你又恰好在面试的时候表现很好就很可能顺利拿到Offer。
不过,这种“运气”并不常有。因为产品经理入门的门槛比较低,所以很多企业会把招聘的门槛设在学历和经历这些硬性指标上。
看到这儿你是不是有些气馁难道我之前付出的努力全都白费了吗当然不是。相比于传统产品经理AI产品经理的处境可好太多了。 AI 产品经理有天然的稀缺性,还有专业技术加持,现阶段企业对 AI 产品经理的要求放得比较宽,毕竟目前这方面的人才还是太少了。
因此如果你想抓住AI产品经理岗位现阶段的红利顺利拿到Offer、进入大厂除了要学好我们的专栏夯实AI技术能力面试环节也是必须要重视的。这节课我就带你梳理一下AI产品经理面试的常见问题和应对策略。
面试官在考察候选人之前,事先都会对岗位进行定义,再决定问你哪些问题。虽然产品经理日常大多数情况下都在画原型、写文档,但面试官并不会考察这些,毕竟意义不大。
那么,在 AI 产品经理的面试过程中,面试官会从哪些角度,来观察考察候选人的哪些基本素质呢?接下来,请你把自己代入面试者的角色,和我一起来参加这场面试实战吧!
## 过往经历介绍
首先,欢迎你参加这次面试,请先做个自我介绍吧!说说你在上一家公司主要负责什么,你做过的最有价值的一件事是什么?
这几乎是所有面试的开场白,你一般都是怎么回答的呢?我发现经常会有面试者这么回答:“我做了大量调研工作,写了调研报告,然后画了原型图,最后产出了 PRD文档经过评审敲定了最终的方案然后是研发开发产品上线之后效果还不错。”
类似这样的回答其实没有提供给我有效的信息,因为这样的工作流程不仅和其他人的一样,还没有具体的细节,体现不出来候选人的产品思维和设计能力,甚至还会让面试官感觉你的项目经历是造假的。
那我们该注意些什么呢?**在介绍工作内容的时候,你要注意有逻辑、有数据、有价值。**也就是说你要注意每件事情发生的前因后果,它们之间的逻辑关联,同时追求真实性,不造假。**更重要的是,要更多地展示出自己对工作的认知,在讲流程化工作内容的基础上,提供一些有价值的内容**,比如相关项目的数据表现等等。
下面是我给出的一个示例,你可以参考一下。
我在上一家公司主要负责的是旅游品类产品的设计,做了两个重点的项目,分别是用户留存模型和智慧营销模型。
在用户留存模型的项目中,我先基于现有留存数据和用户行为数据进行定量分析,又基于用户调研和访谈进行定性分析。然后,我对用户流失原因进行了判断,提出可能造成流失的原因,并提出了提升留存的备选方案。接着,我就和算法同学沟通各种方案的落地成本,最后进行了实验,确定各个方案的优先级,最终推进了用户留存模型产品的建设,它的数据表现是这样的……
## 产品行业认知
接下来,请说说你们产品的主要竞品是谁?你认为的行业现状什么样?你对行业未来发展趋势的理解,以及你最喜欢的一款 AI 产品是什么?
这是面试官在考察一个 AI 产品经理除了作为产品功能设计者之外,对所负责产品行业的认知,是否具备一定的行业视野。一个卓越的产品经理一定是能快速讲清楚**自己产品在行业中的份额、竞争力和不足,以及市场现状布局和未来走势**等等。
想要回答好这些问题你可以参考专栏第一篇章“知己知彼AI和AI产品经理”里面的内容别忘了一定要结合自己的行业现状。
## 产品案例问题
接下来,就到了这次面试的第一个小高潮,你做过什么产品案例呢?如果我们最近遇到一个这样的问题,业务方希望我们通过 AI 预测有买花需求的用户,然后给他们发 push你有什么好的想法吗
这类产品案例问题一般都是招聘部门真实遇到过的问题,面试官并不会真的预期你能在几分钟给出一个完美的答案,他只是在考察你**分析、拆解问题的能力,以及结构化思维逻辑的能力**。
针对上面的问题,你会给出什么答案呢?如果是我作为面试官,我希望面试者能从项目建设的视角出发,思考和拆解各环节的工作,然后给出每个环节的工作内容、交付物,也就是如下的步骤:
* 产品定义,做这件事情的背景、价值、以及预期目标都是什么;
* 技术预研,判断目前积累的数据和沉淀的算法,是否可以达到我们的业务需求;
* 准备数据,根据模型预研的结果以及公司的实际情况,来帮助算法同学准备数据;
* 模型构建,产品经理协助算法工程师进行模型的构建,并对最终交付的模型进行验收;
* 工程建设,产品经理协调研发团队、算法团队,以及其他第三方的资源依赖,推进需求的产品化落地工作;
* 效果评估,上线后持续对效果进行监控、迭代模型。
基本上,这样的回答就可以让面试官满意了。但如果你是一名高级产品经理,我还建议你可以从业务经验出发,给出一些具有启发性的答案,这会是你的加分项。
## AI 技术问题
最后,面试官会考察你一些 AI 技术问题,这和传统互联网公司的产品经理面试有很大的不同。
目前,人工智能领域的岗位细分还没有成熟,很多企业并不会设立 AI 产品这样的部门,面试官很多都是纯算法或数据出身的人,所以在考察你岗位能力的时候,很自然地就会考察你对技术掌握的深度和广度。
因此你在准备AI产品经理面试的时候也要对技术问题有所准备具体来说就是你要能回答上来算法工程师或者数据挖掘工程师的初级技术面试题。
面试官经常会问的技术问题有两类,分别是**基础技术问题和算法问题**。基础技术问题可能会问什么是特征清晰、数据变换、训练集、验证集、测试集什么是过拟合、欠拟合、跨时间测试和回溯测试机器学习的三大类应用场景是什么算法类问题可能会问逻辑回归和线性回归的区别是什么什么是KNN、聚类分析、决策树模型等等。
## 小结
如果你已经准备参加AI产品经理的面试了那么我希望你能从 6 方面做好面试的准备分别是行业知识、项目流程、基础技术、模型评估、经典算法以及场景案例。我一共准备了20道典型的问题把它们按照分类总结在了一张思维导图里你可以利用它先来检测一下你各方面知识的掌握程度。
![](https://static001.geekbang.org/resource/image/3c/9b/3c540cyy3b2a94386c3af7db3f3d429b.jpg)
为了方便你进行验证,我把这些问题的考点、思路和参考答案都梳理在了下面,希望你能好好利用起来。
行业知识问题
问题1你怎么看待 AI 或者人工智能行业?
考点:考察你对当前人工智能行业发展情况的了解,是否具有预判未来发展趋势和潜在机会的能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,最好举一两个当前 AI 的新技术或者新应用来表达你在实时关注这个行业;最后,一定要给出你对这个行业独特的看法。
回答我认为当前人工智能行业正在逐步从实验室走向工业界。从产业链条上看AI 主要分为三层,最底层是芯片、云服务等组成的基础支撑层。中间是提供底层 AI 技术的技术层,比如商汤、依图等提供的图像识别技术。上层是应用层,也就是我们最常见的电商搜索推荐,教育行业的 AI 课程。
从应用场景上看,金融、安防、客服是我们目前应用十分广泛的领域。同时,其他行业也在逐步引入 AI 技术。比如好大夫在线,最近就分享了他们如何通过 AI 技术,来进行医学报告单结构化的工作。
在我看来AI 现在的应用还远远不够,可能 3 年或 5 年之后AI 必将成为一种基础设施,应用在各行各业,这就有点类似我们 10 年前讨论的移动互联网技术,现在绝大多数行业都离不开移动互联网,移动互联网技术已经成为了行业的基础建设了,那么 AI 大概率也会走上类似的道路。
问题2对于业务场景通过 AI 技术可以做哪些工作来提升用户体验?
考点:考察你对于业务场景的理解程度以及 AI 技术边界的了解。
思路首先你需要问清楚对方的业务场景是什么他的用户是谁用户需要通过这个产品解决的问题是什么然后再考虑目前的AI技术是不是可以有提升点。如果你对对方提供的业务场景不了解也可以说你们公司或者你了解的某些业务场景毕竟面试官不是为了套你的方案而是为了考察你对于 AI 技术边界的了解,和你是不是具有发现需求的能力。
回答:我对您这边的业务还不太了解,不过我之前在一家线上旅游公司工作,我们的模式是直接根据用户搜索结果展示旅游产品列表。但其实我们可以根据每个商品的好评率,对其进行解析,形成一个简单的一句话评论展示在产品列表中,帮助用户进行选择,提高用户点击率。
问题3现在市场上有哪些竞品公司有什么优缺点
考点:同问题 1考察你人工智能行业发展现状的了解以及基于你所处业务的同类 AI 竞品公司的分析能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,针对你所处的行业来表达你们的产品技术和竞品的产品的定位、受众,以及优劣势等;最后,一定要给出你对所处行业独特的看法。
* * *
项目流程问题
问题4你们的模型构建流程是怎么样的
考点:考察你对 AI 项目构建过程的熟悉程度,类似于传统产品经理建设研发项目的过程。
思路:先回答 AI 项目从筹备到上线的全过程,比如分几个阶段,每一个阶段都有什么角色参与,每个角色需要做什么工作,他们的产出又都是什么。然后再回答 AI 产品经理的完整工作流程是什么,需要参与哪些阶段和具体的工作。
回答:具体的回答,你可以参考第 05 讲。
问题5AI 产品经理和传统产品经理的区别是什么?
考点:考察候选人除了对通用的产品能力理解之外,是否熟悉 AI 行业、产业结构,是否了解实现目标的技术手段、算法等等。
回答:具体的回答你可以参考第 02 讲。
* * *
基础技术问题
问题6什么是特征清洗、数据变换
回答:数据清洗就是对数据进行清洗,去掉重复值、干扰数据,以及填充缺失值。
数据变换就是将数据处理成方便模型使用的数据形式。比如我们需要使用用户的身高作为模型特征,但是有的数据是用厘米作单位,有的数据会使用米作单位。这个时候,我们就需要使用归一化,把数据的单位统一成米或者厘米。归一化也是数据变换最主要的手段。
问题7什么是训练集、验证集和测试集
回答:训练集是让机器学习的样本集合,用来拟合模型。验证集是模型训练过程中,用来对模型性能做初步的评估,用于模型参数调优。测试集是最终用来评估模型效果的。
问题8什么是过拟合和欠拟合
欠拟合就是偏差较大,指的是模型的预测结果和实际结果的偏差比较大,说白了就是模型预测不准。造成欠拟合的原因可能是特征少或者模型训练不足。过拟合就是方差偏大,指的是模型在一部分数据上表现好,在另一部分数据上表现差。造成过拟合的原因可能是特征过多而训练集不够。
问题9什么是跨时间测试和回溯测试
回答:跨时间测试也叫 OOT 测试,是测量模型在时间上的稳定性。回溯测试是用过去一段时间的真实数据构造出一个模拟的环境(回溯环境),让模型在历史的那段环境中运行,得到历史某个时间点的模型结果。
一般来说,跨时间测试是在模型上线之前就应该要做的事情。回溯测试是指模型已经存在并已经上线了,想要看模型在历史某个时间点的数据表现时候,进行的测试。
问题10机器学习的三大类应用场景都是什么
回答:三大类应用场景分别是分类问题、回归问题、聚类问题。
分类问题又可以分解成二分类问题和多分类问题。二分类问题的预测结果只有两个离散的值,如“是/否”"1/0"。多分类问题的预测结果是多个离散的值如“A、B、 C”。
回归问题的预测的结果是连续的值,如房价的预测、库存的预测。聚类问题是无监督学习,将相似的样本归类在一起,如细分客户、新闻聚类。
* * *
模型评估问题
问题11你怎么评估模型的好坏
考点:考察你模型评估指标的掌握程度,回答时要说明模型评估的三个部分:统计性、模型性能和模型稳定性。
回答:模型评估的好坏可以通过模型评估指标进行衡量,模型评估指标包括三部分,分别是统计性指标、模型性能指标和模型稳定性指标。
统计性指标指的就是模型输出结果的覆盖度、最大值、最小值、人群分布等指标。
模型的性能评价指标主要包括混淆矩阵、KS、AUC 等等。通过混淆矩阵我们就可以得到一个模型的精确率、召回率这些指标从而可以评估一个模型的区分能力也可以计算得到TPR、FPR从而计算出AUC、KS等相关指标。
回归模型的性能评价指标主要包括MAE平均绝对误差、MSE均方误差、RMSE均方根误差、R 方等。
模型的稳定性即判断模型输出结果是否会随着时间推移而发生较大变化不再稳定的指标主要使用PSI进行评估。
问题12什么是 ROC 曲线?
回答ROC 曲线是分类算法模型的一种评价标准ROC 曲线的横坐标为假阳性率 FPR、纵坐标为真阳性率 TPR计算公式为 FPR = FP / NTRP = TP / P其中 P 是真实的正样本数量, N 是真实的负样本数量TP 是 P 个正样本中被分类器预测为正样本的个数FP 是 N 个负样本中被分类器预测为负样本的个数。
以一个医院诊断病人为例,假设有 10 位疑似感染患者,其中 3 位很不幸诊断阳性P = 3另外 7 位诊断阴性N = 7对于诊断阳性的 3 位患者,其中有 2 位确实是真正的患者TP = 2。那么真阳性率 TPR = TP / P = 2/3对于 7 位诊断阴性的患病者来说也很不幸误诊了一位患者FP = 1那么假阴性率 FPR = FP / N = 1/7。
对于分类器来说,这组分类结果就对应 ROC 曲线上的一个点 (1/7, 2/3),最后,由分类器计算出来的多个点组成 ROC 曲线。
问题13什么是 AUC
回答AUC 指的是 ROC 曲线下的面积大小,它能够量化地反映出基于 ROC 曲线的模型性能AUC 的取值一般在 0.5 ~ 1 之间AUC 越大,说明分类器性能越好。
* * *
经典算法问题
问题14逻辑回归相比于线性回归有什么区别
考点:考察候选人对于线性回归和逻辑回归的理解。
回答:首先,它们最主要的区别是:逻辑回归解决的是分类问题,预测属于某类的概率;线性回归解决的是回归问题,预测一个连续变量(如降水量,价格等)。
线性回归使用的是最小化平方误差损失函数,对偏离真实值越远的数据惩罚越严重,容易受到异常值影响。逻辑回归是一种减小预测范围的函数,它将预测值限定为\[0,1\]间,不容易受到异常值的影响。
问题15你能介绍一下 KNN 的原理吗?
回答KNN 核心原理可以理解为“近朱者赤近墨者黑”,即基于距离的一个简单分类算法。在数据量不多,并且特征都相对单一的业务场景下,很适合选择 KNN 算法(详细内容见 09 讲)。
问题16你能介绍一下聚类分析吗
回答:聚类分析属于无监督算法,是按照个体的特征将数据分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性。
K-means 算法是机器学习领域中处理无监督学习最流行、经典的聚类分析方法之一。它是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,待测样本点距离聚类中心的距离越近,它的相似度就越大(详细内容见第 15 讲) 。
问题17你能介绍一下决策树模型吗
回答:随机森林的原理可以理解为“三个臭皮匠赛过诸葛亮”,特点是具有树形结构,可解释性强,直观好理解,而且还可以从结果向上去追溯原因。采用决策树可以更方便地向老板、业务方,或者甲方去解释模型是什么。
比如在金融风控场景下,我们经常通过决策树判断用户的违约风险。决策树在预测用户违约案例上的核心思想是,先获取部分用户的历史数据,历史数据包括过去的信贷数据和还款结果,然后将贷款客户不断进行分类,直到某个节点的样本用户都是同一个类型为止。最后,再对决策树进行剪枝,简化树的复杂度(详细内容见 13 讲)。
* * *
场景案例问题
问题18请举例说明如何设计一个推荐类的产品。
考点:考察候选人对推荐类产品的召回、排序、调整各阶段的理解。在回答推荐类产品设计问题时,要明确每个阶段的基本策略和工作内容,最好还要了解相关经典算法或模型,比如召回阶段的协同过滤,以及排序阶段的 CTR 预估(详细内容见第 23 讲)。
问题19请举例说明如何设计一个预测类的产品。
考点:考察候选人对于预测类产品场景化的落地经验。
思路:首先,根据应用场景不同,这类需求可以分为分类任务和回归任务,比如用户复购模型预测就是分类任务,而酒店价格预测就是回归任务。
其次就是产品经理要站在业务场景下,阐述推进 AI 产品建设的全过程,从数据准备到模型构建,再到模型验收,以及部署上线,各环节产品经理需要参与的工作,以及工作内容和评价标准(详细内容见第 27 讲)。
问题20请举例说明如何设计一个自然语言类的产品。
考点:考察候选人对于 NLP 的理解,这个问题面试官会基于具体的场景来考察候选人,比如,如何设计一个对用户评论分析挖掘的产品。
如果是基于这样的场景提问,候选人要先说明 NLP 能做什么,然后再回答其中涉及的具体工作,比如评论挖掘就会涉及用户情感分析、用户标签挖掘、用户评论相似度分析,以及评分质量打分等等(详细内容见第 29 讲)。
## 课后讨论
如果你真的参加了一场 AI 产品经理的面试,你觉得自己的核心竞争力是什么?
期待在留言区看到你的故事,我们下节课见!