gitbook/检索技术核心20讲
2022-09-03 22:05:03 +08:00
..
docs 课程提交 2022-09-03 22:05:03 +08:00
book.json 课程提交 2022-09-03 22:05:03 +08:00
README.md 课程提交 2022-09-03 22:05:03 +08:00
SUMMARY.md 课程提交 2022-09-03 22:05:03 +08:00

检索技术核心20讲

你将获得

  • 5 类数据结构的原理和应用
  • 15+ 行业真实应用案例详解
  • 4 大热门行业检索架构和设计
  • 从基础到实践,构建检索知识体系

讲师介绍

陈东数禾科技CTO以数据和技术驱动为金融机构提供高效的智能零售金融解决方案。曾任奇虎360商业化资深总监负责展示广告的研发管理和产品创新。

在互联网广告行业深耕十余年,致力于弹性分布式系统架构、检索引擎与推荐系统等技术方向。

课程介绍

在日常的工作或者面试中,经常会遇到一些与查询相关的问题,比如:

  • 如何从海量数据中查询同时带有“极”和“客”字的唐诗?
  • 为什么很多日志系统使用NoSQL数据库而不是关系型数据库
  • 在爬虫系统抓取网页之前如何快速判断一个URL是否已经被抓取过

其实,这些问题都属于检索技术的研究范畴。检索技术已经成为互联网时代技术人必不可少的技能之一,因为其应用极其广泛。

一方面,很多平台的架构设计都有相似的检索模块,比如搜索、推荐、广告等;另一方面,用好检索技术还可以帮助我们有效提升程序的执行效率,比如,只要我们能合理地使用数据库的索引功能,那程序从数据库中检索相关数据的速度就能提升好几倍。

在这个专栏中陈东会通过20篇文章将他十多年打造高性能广告引擎的工作经验以及针对各种检索业务的深入思考和理解分享出来。带你系统地学习高效的检索方案和设计思想到底有哪些到底怎么用并且会结合工业界中的具体业务场景从最简单的解决方案入手一步一步带你分析各种方案的优缺点找到最优解。

专栏共包含三个模块,分别是基础技术篇、进阶实战篇和系统案例篇。

基础技术篇聚焦5大类核心的数据结构和检索算法包括线性结构检索、非线性结构检索、哈希检索等着重讲解它们的存储特点和检索效率帮你理解检索技术的本质并且能够在代码级别提升运行效率。

进阶实战篇分析工业界中的高效检索方案详细讲解其中涉及的高级检索技术总结一些架构设计思想比如读写分离、索引和数据分离、空间检索、Top K搜索。掌握这些设计思想和高级技术能够大幅度提升检索效率帮你解决实际工作中的检索难题。

系统案例篇:剖析当前热门的存储系统、搜索引擎、广告引擎、推荐引擎。学习这些系统是如何应用检索技术架构的、关键环节如何处理,从而帮你扩大知识面,拥有架构师、设计者视角,能够从更高的角度去思考问题、解决问题。

课程目录

适合人群

1.初级工程师大学刚毕业或者拥有05年的工作经验只要熟悉数组和链表知道怎么评估时间代价即可。
2.中高级工程师有5年以上工作经验从事搜索引擎、广告系统、推荐系统相关工作。
3.任何在提高程序运行效率上遇到难题、想要拓展设计思路的程序员,都可以学习本专栏。

特别放送

  1. 订阅后分享海报,每邀一位好友订阅有现金返现。

  2. 戳此申请学生认证,享五折优惠。

  3. 4-5月课表抢先看充值购课更优惠充 ¥500 得 ¥580 豪礼限时赠!

  4. 戳此申请技术交流&福利群

活动推荐

大数据训练营第0期重磅上线特惠立抢

限时活动推荐

极客时间送书啦!精选好书 0 元领,数量不多先到先得,点击获取>>>

订阅须知

  1. 本专栏为订阅专栏,形式为图文+音频定价99元。现已更新完毕。订阅成功后即可通过“极客时间”App端、小程序端、Web端永久阅读。
  2. 企业采购推荐使用“极客时间企业版”,便捷安排员工学习计划,掌握团队学习仪表盘。
  3. 本专栏为虚拟商品,一经订阅,概不退款。