zoukankan      html  css  js  c++  java
  • 【搜索引擎 (一)】绪论

      自己对搜索引擎有一些兴趣,而且也选修了这门课,看到的搜索引擎用到的知识还是挺丰富有深度的,所以准备写个系列的文章,参考《现代信息检索》(贝佐·耶茨)和一些其他教材。

      搜索引擎中用到的技术

      由于搜索引擎用到的技术实在太多,所以不能一一列举。并且事实上中文博客中搜索引擎的知识主要集中在基础的知识上,所以搜索引擎的知识要讲的话就不会再重复太多讲过的知识,而是更加系统的项目上了。

      关于搜索引擎计划要开始以下的部分:

      1. 索引和倒排索引、哈希表、跳表

      2. 文本分类

      3. Page-Rank算法

      4. 大规模爬虫、去重用的局部敏感哈希

      5. 社交网络、协同过滤

      6. 查询策略

      7. 为什么叫做搜索引擎,为什么不叫数据库?

      8. 图聚类

          这些只是一些想到的部分,以后不一定要按照顺序来写。

  • 相关阅读:
    echarts-五分钟的教程
    vue中的路由
    2x or 3X的图
    background-size cover和contain的用法详解
    吃转基因有害?科普这么多年咋还有人信!
    基于UDP协议的Socket通信
    基于TCP协议Socket通信
    echarts地图
    Ehcache缓存实例
    Tomcat配置绝对路径
  • 原文地址:https://www.cnblogs.com/wangzming/p/7235252.html
Copyright © 2011-2022 走看看