@knight
2015-07-08T23:19:24.000000Z
字数 379
阅读 2033
搜索引擎知识点
搜索引擎
笔记
PageRank 压缩 拼写检查和建议 查询扩展 相关反馈
1 搜索引擎和信息检索
2 搜索引擎的架构
- 什么是软件架构
- 基本的构件
- 组件及其功能
- 文本采集
- 文本转换
- 索引的创建
- 用户交互
- 排序
- 评价
- 搜索引擎是如何工作的
3 信息采集和信息源
- 确定搜索的内容
- 网络信息爬取
- 抓取网页
- 时新性
- 面向主题的信息采集
- 深度网络
- 网站地图
- 分布式信息采集
4 文本处理
5 基于索引的相关排序
6 查询与界面
- 查询转换与提炼
- 拼写检查和建议
- 查询扩展
- 相关反馈
7 检索模型
- 布尔检索
- 向量空间模型
- 概率模型
- 将信息检索作为分类问题
- BM25排序算法
- 基于排序的语言模型
- 查询项似然排序
- 相关性模型和伪相关反馈