搜索引擎架构实战
课程预演
第一课时【基础数据结构】
概要
倒排索引,正排索引
哈希表,跳表,B + 树
代码实现
第二课时【构建索引】
索引构建
内存构建,磁盘构建
代码实现
第三课时【搜索查询】
搜索查询
倒排查询,交集,并集
bitmap,Mmap
代码实现
第四课时【整体实现】
网络模型封装
提供搜索服务
排序,机器学习相关
代码实现
第五课时【搜索排序】
分词
搜索词相关性和排序
代码实现
开课时间:随时
有效时间:1年内观看有效
上课时间:随时
免费观看课程预演回放视频
技术应用背景
搜索引擎技术是给非结构化的数据提供一种初步的数据画像、数据分析工具,为进一步的数据分析提供前置的技术支撑。
好的大数据分析实践离不开结构化的,干净的数据,只有在干净数据基础之上才能保证大数据分析结果。在目前如火如荼的大数据背景下,信息检索技术也必须被重视和进行优化实践。
然而,非搜索技术领域出身的人想要了解到相关技能实际上是非常困难的。所以,StuQ 特邀请搜索引擎技术专家吴英昊老师(微信公众号:西加加)开设《搜索引擎架构实战》课程,带你从0到1,构建一个完善的搜索引擎系统。
课程介绍
本课程会通过实现一个实际搜索引擎来阐明在数据检索领域的一些基本技术点,包括"搜索引擎基础数据结构","分词系统","索引系统","检索系统","排序系统","分布式搜索引擎",同时还会稍微涉及一些机器学习的排序算法。
所有内容将使用 Go 语言进行实现,这也是一个实践 Go 语言的好机会。:)
九枝兰科技技术团队搜索引擎架构专家,负责整体架构和算法设计。XJJ267(西加加)公众号作者。曾在当当网担任搜索架构师(兼开发经理)职位,负责整个当当网的搜索后台的技术架构和技术团队的管理,包括搜索引擎架构,搜索排序算法和 Query 分析(偏自然语言处理)三个小组。个人专栏:https://segmentfault.com/blog/wusay。微信公众号:XJJ267(西加加)。2015,在 WOT 开发与运维大会,分享主题《快速多变的电商搜索引擎》;
课程预演
概要
倒排索引,正排索引
哈希表,跳表,B + 树
代码实现
索引构建
内存构建,磁盘构建
代码实现
搜索查询
倒排查询,交集,并集
bitmap,Mmap
代码实现
网络模型封装
提供搜索服务
排序,机器学习相关
代码实现
分词
搜索词相关性和排序
代码实现