zoukankan      html  css  js  c++  java
  • 分享 百度网盘搜索引擎原理以及实现部分源码

    先给出大家示例:百度网盘搜索示例参考https://pan.90xz.com/

    一、搜索引擎结构

    网盘搜索引擎---》既然是搜索引擎---》最终都是蜘蛛爬寻程序

    蜘蛛爬寻就必须有网,网在哪里呢,百度都给你了,但现在隐藏了如下图

    图上红色字体 【粉丝】,和【关注】 这俩货百度给隐藏了,原来都显示,记住是隐藏了,相当于程序的警告,无视他,当然你也看不到。

    网就在粉丝和关注这里,关注相当于吴亦凡,粉丝就是吴亦凡的一个小粉丝,如果其中一个小粉丝在关注下苍老师,那粉丝就无穷无尽了。这就是蜘蛛爬寻的网的结构。

    二、主要结构API--js调用地址

    以下{0}=237243058=用户Id

    1.获取粉丝

    http://pan.baidu.com/pcloud/friend/getfanslist?query_uk={0}&limit=24&start=0&bdstoken=null&channel=chunlei&clienttype=0&web=1

    2.获取关注

    http://pan.baidu.com/pcloud/friend/getfollowlist?query_uk={0}&limit=24&start=0&bdstoken=null&channel=chunlei&clienttype=0&web=1

    3.获取分享

    http://pan.baidu.com/pcloud/feed/getsharelist?t=时间&category={1}&auth_type=1&request_location=share_home&start=0&limit=100&query_uk={0}&channel=chunlei&clienttype=0&web=1&bdstoken=null

    {1}=0、1、2、3、4、5、6==全部分享专辑图片文档音乐视频其他 这个自己一一对应吧

    4.获取分享专辑

    http://yun.baidu.com/pcloud/album/getlist?t=时间&start=0&limit=100&query_uk={0}&channel=chunlei&clienttype=0&web=1&bdstoken=null

    以上返回都是json数组

    采用的是Newtonsoft.Json 反序列化类。

    Newtonsoft.Json  用法http://www.cnblogs.com/yanweidie/p/4605212.html

    三、需要实现功能

    1.代理IP

    毕竟百度不是全心全意支持你爬寻他的,必须用匿名代理Ip来实现爬寻API 

    C# 通过代理发HTTP请求 https://q.cnblogs.com/q/88682/

    2.这么多资源怎么让人看到呢

    盘古+Lucene .net  实现 大牛盘古介绍使用http://www.cnblogs.com/eaglet/category/143427.html

    2千万资源搜索速度还是挺不错的,示例:百度网盘搜索引擎https://pan.90xz.com/ 90网盘

    3. mvc+NVelocity 模板解析

    NVelocity  简介http://www.cnblogs.com/wysky/archive/2007/12/06/985832.html

    四、其他要说的事

    1.觉得不错的话多多推荐一下吧:百度网盘搜索引擎https://pan.90xz.com/ 90网盘 ^_^

    2.功能实现容易,推广难,再推荐一下吧

    3.源码太多 方法最重要就不展示了,源码下载分享-----卡卡卡

    4.学习提高 kindle电子书:

    https://book.90xz.com?wid=1

    it电子书 https://book.90xz.com/IT?wid=1 登陆才能查看

    5.以上所贴博客园文章是作者自己百度/谷歌搜索所得,自己参考了

     

     

     

     

     

  • 相关阅读:
    一起做一款开源软件吧--开源软件诞生1
    牛客-紫魔法师(仙人掌染色-判奇环)
    牛客编程巅峰赛S1第12场 王者C-椭圆曲线(快速乘的运用)
    牛客编程巅峰赛S1第12场 王者B-上上下下(DP)
    牛客编程巅峰赛S1第12场 王者A-锻炼身体(树上追击问题)
    CSUSTOJ 1127-区间方差(线段树)
    Codeforces 1398C- Good Subarrays(区间值为0的个数变形-思维)
    CSUSTOJ 4000-你真的会数据结构吗?(状压+素数分解)
    牛客练习赛67 F-牛妹的苹果树(树上最远点对/区间带权直径-线段树+LCA)
    牛客练习赛67 E-牛妹游历城市(拆位最短路)
  • 原文地址:https://www.cnblogs.com/yang0000meng/p/6647954.html
Copyright © 2011-2022 走看看