zoukankan      html  css  js  c++  java
  • 《文献管理与信息分析》第二章

    科研工作者需要有信息素养,在学习之前首先得找到要学习的信息,所以一个人的学习能力很大程度上取决于信息搜索能力。本节课主要讲述信息搜索。

    信息获取依赖于资源和方法,我们可以查找图书类(时效性差,品种较少,无法赶上快速发展社会的需要)、使用搜索引擎(快速、高效)、通过社交网络进行询问(需要一定量的粉丝)、阅读推送的信息(如RSS定制)。我们需要建立搜索意识(搜索使用的好与坏关系学习和工作能力),掌握基本的搜索技巧(基本检索、高级检索、取词、优化、反推、转换等)、掌握利用搜索引擎解决问题的思路 。

    搜索引擎并不直接搜索网络,而是搜索已经建立的索引。不同的搜索引擎爬取的范围和数量不同,索引的方法不同,搜索引擎的异同,反馈的结果数量不同,排序的方式不同,交互的功能不同,结果的呈现方式不同。搜索有三种境界,分别是搜索引擎的使用入门,搜索进阶(基本逻辑关系),高效搜索(搜索命令的使用)。Google 收录范围最广,提供多种精炼功能;百度中文收录最大,广告多;360收录结果偏少,但质量相对较高(可以看到用户对网站的喜爱程度)。

    Google 的 search tools 这项功能挺有意思,针对新闻、图片、视频有不同的选项,比如可以查找指定颜色的图片,类型为人脸的图片:

    Google 搜索命令(组合利用功能更加强大):

    • AND、OR:必须大写,否则会被认为是普通的单词。AND指令一般以空格代替,还可以用+代替。OR指令用|代替(OR优先于AND)
    • - (逻辑非)
    • "…" 代表完整匹配,搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配
    • * 代表多个字符, ? 代表单个字符
    • site: 在某个网站或域名下搜索。如 “区块链 site:pku.edu.cn”命令可以查看北京大学对区块链的研究。又如 site:cnblogs.com 表示在博客园上搜索相关内容。在Google和百度中输入相同代码,发现二者的搜索结果还是有很大区别的......

    • filetype: 搜索某种类型的文件。如 filetype:pdf 表示只搜索 PDF 文档
    • intitle: 在网页标题中查找。allintitle 返回结果将返回在标题中同时包含所有搜索项的网页。如 allintitle:blockchain finance = intitle:blockchain finance
    • inurl: 搜索查询词出现在 url 中的页面
    • inanchor: 搜索查询词出现在链接锚中的页面,返回的结果页面本身并不一定包含查询词(inurl是网页本身的url地址,而inanchor是在外部用于指向该url地址的文本(之间文本)中找)
    • intext: 在正文中检索
    • link: 搜索所有链接到某个url地址的网页,可以迅速判断一个网页的“热度”
    • related: 寻找某网页的“相关”网页。相关一般指的是有共同外部链接的网站

    此外,按图片搜索可以帮助我们判断网上信息的真实性,搜索风云榜(后加trends)可以了解某个关键词被搜索的情况,可以按时间、地域进行统计。

  • 相关阅读:
    unsupported jsonb version number 123
    如何在MPlayer上支持RTSP
    TDengine 时序数据库的 ADO.Net Core 提供程序 Maikebing.EntityFrameworkCore.Taos
    如何使用IoTSharp对接ModBus?
    如何从源码启动和编译IoTSharp
    Asp.Net Core 自动适应Windows服务、Linux服务、手动启动时的内容路径的扩展方法
    MQTTnet 的Asp.Net Core 认证事件的扩展
    Asp.Net Core 中利用QuartzHostedService 实现 Quartz 注入依赖 (DI)
    The remote certificate is invalid according to the validation procedure 远程证书验证无效
    settings插拔式源码
  • 原文地址:https://www.cnblogs.com/Jspo/p/8360366.html
Copyright © 2011-2022 走看看