You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

106 lines
14 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 内参特刊 | 和你聊聊每个人都关心的人工智能热点话题
受极客邦科技邀请1月份我回国参加AICon1月13日晚做了一场直播直播的主题是“人工智能20问”编辑们收集整理了一些大家感兴趣的有关人工智能的话题我在直播中分享了我自己这些年来的一些经验和心得。这场直播的文字精简版已经发布在InfoQ的公众号上今天我也和你在专栏里分享希望其中的某些话题能够对你有所启发也欢迎你留言和我讨论。
## 暖场篇
> Q您本硕博学的都是计算机科学专业这个专业其实有很多方向您为什么会选择人工智能这样一个比较新的领域
A我到美国读博的时候开始并没有想去学习人工智能而是想做一些操作系统及软件的研发。到了美国以后我的导师认为社交媒体的数据挖掘、机器学习应用比较前沿希望有一个相关课题当时把新的课题给了我。我从这个课题入手接触了机器学习接触了人工智能然后慢慢地走上了人工智能的发展方向。
> Q您怎么定义人工智能
A我认为人工智能有两个方面非常重要。一是人工智能是**数据驱动**的,也就是说一个人工智能产品一定得是有数据支撑的;另一方面人工智能是一个**持续的决策过程**比如说AlphaGo、无人驾驶等都是利用机器学习以及其他算法进行持续决策的一个过程。**在人工智能这个定义中,数据驱动和持续决策应该说是非常重要的两个元素**。
## 落地篇
> Q您能不能详细介绍一下目前在Etsy有哪些人工智能的技术是实实在在落地了的落地的场景是什么取得了什么样的效果
AEtsy人工智能应用主要是围绕三块在做。
第一块是**搜索**。其实这也是普通电商的一个场景你来到电商平台输入一个关键字Etsy返回一个搜索的结果这个看上去很简单好像跟传统的搜索没有什么区别。但实际上电商的搜索不管是大一点的电商如亚马逊、京东、阿里还是小一点的电商真正能够做到比较完美的搜索体验是非常困难的。比如一部分用户的购买欲望很强烈那么我们如何能够帮助他找到最合适的商品也有一部分用户并没有特别强的购买意愿这个时候他希望通过搜索一些关键字来获取灵感从你的平台上能得到一种逛街的体验所以这个时候搜索带来的东西就未见得一定是他要买的如何能够通过搜索给他带来逛街的体验是比较困难的。这块搜索是我们现在一直在做的并且用不同的模型来进行落地尝试。
那么第二个方向就是**推荐系统**。电商的推荐也是一个老生常谈的话题了但在一些新的场景下如何做比如Etsy上有很多的商品是手工艺品数量可能很少那么在给用户推荐的时候必须考虑到它的件数是有限的这个地方也是有一些难点。
第三个当然就是我们的**广告平台**。如何能够通过人工智能帮助广告提升,广告是一个买卖的双方系统,如何帮助卖家实现好的宣传效果,这个也需要通过算法来更新的。
> Q目前已落地的一些人工智能技术起到的作用和我们传统的一些办法相比效果明显吗
A人工智能在搜索广告和推荐这块效果已经比较明朗了肯定是比传统的方法做得好但是它的提升度在不同的情况下区别还蛮大的。**我们如果能够让效果最大化,必须跟产品界面,还有前端等融合,形成一个统一的产品,才能让算法得到的结果以最好的形式展现出来**。
> Q您认为人工智能落地遇到的最大的一个挑战或者困难是什么
A**现在人工智能落地最难的并不是算法本身,最难的是和场景的对接**。算法本身可能是一个数学描述,是个模型,但是真实的场景跟模型中间还有一段距离。**这个距离需要数据科学家进行“翻译”,把我们的场景和算法衔接起来,需要我们的工程师,能够去根据新翻译的场景调整算法**。所以不是所有的经典的算法你都能够马上利用,而是需要一些更改,这种更改必须是基于你的场景,你去理解这个场景,并且能够进行合理的翻译,这实际上是最困难的。
## 观点篇
> Q人工智能对程序员就业有什么影响?
A我刚才已经谈到了数据科学家和人工智能工程师职能有重叠但也略有不同。打个比方就像你踢一场足球赛需要有11个队员有前锋有中场有后卫有守门员一个复杂的人工智能产品需要有不同的角色这些角色都需要有一定人工智能机器学习背景比如说前端工程师一些设计的人员一些产品经理都需要人工智能背景。**那么从这个角度看这个问题,我觉得反而是大家的机会更多了,大家可以根据自己的背景,根据自己的喜好,寻找适合自己的角色**。
> Q人工智能会在哪个行业爆发
A**我觉得另外一个角度看这个问题更好,有多少行业能够去利用人工智能?**就像你刚才提到的,这个人工智能可能会像空气,会像水,会像电一样,成为一个基础设施,我很认同,今年可能会有一些新的契机,我对这方面也很感兴趣。我们也看到,像吴恩达,他想去对传统制造业和人工智能做一些结合,我觉得这个趋势就是一个很好的切入点,不是说现在就能够彻底地改变制造,因为毕竟各行各业有些很深的问题,你得去了解它,但是它可以打开一扇门,让更多的传统行业,比如像制造业的人来了解人工智能,我觉得这个可能会是未来的方向。
> Q现在有一种说法是人工智能就是人工智障您怎么看
A今天我们所看到的人工智能像AlphaGo也好或者图像识别的一些突破云技术的一些突破它的确比10年前比20年前的技术要好的多我觉得人工智能的确到了一个好的阶段。同时我们也必须要承认人工智能不能做的事情也很多并且它做绝大多数事情可能不如我们想象的完美。但是我觉得我们也不必给它贴上人工智障的标签以表达我们的失望之情。**人工智能目前还处于一个很初级的阶段,前面还有很长的路走。我自己希望通过做一个传播者和一个教育者,让更多的人了解人工智能**。
> Q您觉得人工智能存在泡沫吗
A我个人觉得现在的确是有些泡沫比如说媒体的热炒媒体可能不是很了解情况然后去下一些断言。但是我个人感觉现在的泡沫处于一个比较健康的状况这个泡沫帮助更多的人了解这个行业帮助更多的人投身到这个行业帮助更多的社会资源聚焦到人工智能。
## 人才篇
> Q我相信大家都比较关心数据科学团队的招聘的情况您现在会做很多招聘的工作您在招聘的过程中有怎样的一个标准或者最看中候选人的一个特质是什么
A招聘大概有这么几个方面一个是对候选人的**基础知识**的考察,比如说机器学习基础、统计背景、计算机的基本系统的掌握。第二点,我们会给一些场景,去考察这个候选人是否有能力把一个现实的场景跟他所学的挂上钩,他**能否用机器学习或人工智能算法作为一种语言去描述这个场景**,这个能力也是很重要的。第三个是**动手的能力**,比如说他是不是会一些最基本的编写代码,或者数据结构等,大概是分这么三块。
> Q您在专栏里面提到过数据科学家大概有两类您能具体说说这两类吗有什么区别呢
A在国外数据科学家是一个比较范的统称大概有两大类。
一类是**偏数据分析**,比如我有一个商业的问题,或者产品的问题,我想去挖掘这个数据,看能不能回答我这个问题,它重在分析,不偏重如何提高产品品质。比如说他分析圣诞期间什么东西卖得比较火,明年男生会不会更喜欢某款相机,回答类似的静态问题。
另外一类的数据科学家主要侧重于怎么用机器学习的算法提高我们的搜索、推荐或广告效率,更**偏重于驱动产品**。这两类数据科学家的技能有一些重叠的部分,比如最基本的机器学习、统计背景、编程背景等,但是他们的侧重方向不一样。
> Q是不是硕士学历及以上才能做人工智能
A我觉得要分现状和未来两方面。现状是本科生没有全面的一个训练一些需要高阶技能的部分可能硕士也没有完整训练过并不是说做人工智能就一定要博士生而是需要的这些技能刚好只有一些博士生满足。但是随着教育和推广的演进这个门槛会逐渐降低。我跟朋友闲聊的时候经常举一个例子牛顿发明整个力学体系时候那会儿全世界可能只有几个人知道但是现在牛顿力学体系只是高中的一堂课它的门槛低多了。未来人工智能、机器学习的门槛也会降低普通人也可以从事相关的工作。
## 学习篇
> Q如何入门和学习人工智能
A一方面要**去看经典的教材和经典的书籍**,这个是不可或缺的;另一方面,人工智能这个领域发展太快了,很多的新东西都是在**顶级学术的论文**里面,去阅读学习论文也是必不可少的。
> Q如何提高看书的效率
A**这个需要在实践中去学,如果需要某个知识点,要去通读这个知识点相关的内容,相同的内容多看一些不同的观点,把它搞懂搞透**。有的讲的比较粗的,需要去其他地方找到比较细的论证,有的比较细可能没有抽象到一个高度,在其他地方反而能找到,要互补,这样看书的方式是最高效的。
> Q您前面提到除了看书看要看国际会议论文。如果让您给大家推荐三个顶尖国际会议您推荐哪三个
A我个人觉得工业界的朋友可以关注这几个会议。
第一个是**KDD**Conference on Knowledge Discovery and Data Mining数据挖掘与知识发现大会。这个会议有个工业组论文包括一些已经落地的项目经验或者将要上线的经验并且在开会的过程中会跟工业界有互动的环节。你去KDD可以看到很多人在翻译现实中的场景这对工业界的朋友来说是很有帮助的。
另外一个是**WSDM**International Conference on Web Search and Data Mining网络搜索与数据挖掘国际会议。这个会议缘起于雅虎、谷歌等硅谷公司认为传统的学术会议不能满足工业界需求最近几年工业界的不少解决方案和新问题都是在这个会议上提出的。
第三个是**CVPR**Conference on Computer Vision and Pattern Recognition国际计算机视觉与模式识别会议。这个会议可以帮助很多初学者拓宽视野让大家知道机计算机视觉是一个非常广的领域深度学习只是其中的一部分。
> Q外行看热闹内行看门道有很多报道只关注谁获得了最佳论文奖谁获得了终身成就奖除此之外您觉得对于这些顶级会议我们还应该关注什么
A现在这些会议会有上百篇甚至将近一千篇的论文。作为一个初学者或者是想进阶的工程师或者是数据科学家一个比较有效的方法就是**根据你的领域去了解**。像我比较关注搜索、推荐等,我一次性去了解这次会议在该领域大概有多少论文,有些什么新的东西,这就极大的缩小了关注范围,节省了时间。另一个**需要去了解这个会议上有哪些新的想法,这些也许跟你现实的工作不直接相关,但是对于你拓宽视野很有帮助**。
> Q那针对阅读论文我们应该怎么入手呢您的经验是怎样的
A学习人工智能方面的知识特别是读论文很多时候大家觉得难以入手因为有太多的论文一个比较高效的方法是**先读文献综述**。文献综述总结了当前的发展状况,能帮你解决至少两个问题,第一个问题是,了解相关术语,你用这些术语能查到更多相关的东西,如果你连术语都不知道,可能连这些论文查都查不出来,这些综述能帮助你熟悉这个领域的语言,和它里面的一些子问题。另外一个,能够起到文献综述作用的是**国际的顶级会议**这些会议会邀请学者做分享分享往往会有一个PPT这些PPT会归纳最近几年的发展和观点。通过综述和讲座你就已经对这个领域有了一个概念性的理解然后你再去读三到五篇该领域、子领域的经典论文这是我个人去体会过相对比较高效的一个方法。
> Q小白如何入门人工智能
A如果你想真正投身到人工智能我个人建议还要相对系统地去学习整个知识体系比如刚才我们聊过的机器学习、统计、系统概念、最基本的编程的能力等还有一些工具比如Python等磨刀不误砍柴工但这肯定需要一个过程。
> Q目前有个说法Python是机器学习第一语言一般推荐大家先学习Python您怎么看
APython的确是一个比较好的机器语言学习工具并且现在围绕Python也产生了不少生态系统使得Python比较适合机器学习、数据分析或者是一些场景。但这里我必须强调一下**在一个比较完整的端到端的人工智能应用中,特别是工业级的应用中,往往是一个比较异构化的环境**。所谓异构化是指不是单一的语言或者单一的工具就能够完全的把数据转化成你想要的模型并且能够用这个模型去推动我们的产品这里面可能有Python的部分但可能还有Java的部分有C++的部分等如果你真想要有一个进阶成为一个更加全面的工程师或者是科学家就不能只掌握Python。