zoukankan      html  css  js  c++  java
  • 日常琐事的记录,每周六晚做一次总结整理

    因为博士的研究方向最近确定下来会是图像检索相关(希望不会再有变化了),故而决定从最基础的Human Behavior开始着手,首先弄明白人在进行信息获取(Information seek)过程中具体的行为是怎样,会特别是对于网络信息获取过程中的倾向性选择是如何的,评判的标准是怎样的。

    1. 人类在进行信息搜索的过程中,满足“最省事原理”(principle of least effor),一旦找到还可以接受的结果后,信息搜索的行为就会离开停止。这也是目前search engine的基本原理,满足人类search寻找最相关信息的需求。注意:最相关信息是可以接受的结果的一部分,但不是全部,例如当有相关结果已经太多了,如搜可爱的猫,出来的必定都是各种各样可爱的猫,那这个时候图片的质量甚至图片的内容本身就会起到很关键的作用了。而且对于这样不是很spec的搜索,更适合用browse的形式进行引导。

    2. Information Seeking 和Information retrieval的区别

      传统的IR工具是建立在数据源存在且组织良好的假设上,更多的是一种技术导向的方法,关注算法效率以及准确率/召回率等问题。而IS更多的是一种人导向的方法,有的时候人提出一个问题是不是有答案并不知道也不重要,重要的是寻找答案的过程中获得的学习经验。

    3. Sense making原理

      Brenda Dervin认为搜索最根本的目的在于人想要去弄懂不确定的情况,理解/获取信息用来帮助我们做一些和信息相关的决定。

    4. Pareto原理也就是80-20原理,即很多自然行为都符合Pareto分布,比如80%的销售量来着20%的客户,80%的财富掌握在20%的人手里(当然这是所谓的正常自然分布),花园里80%的豆子来着20%的豆荚。是不是搜索行为里有有这样的模式呢,80%的有效信息都来自20%的搜索,而更多的时间其实是被用户用在了browsing,无目的的闲逛上了。

    5. Robinson's(2010)研究表明,用户在进行信息搜索时,会依赖其他人【网络QA】或者信息库【文档数据库等】,用户在两种信息源上花费时间分别为7.8%和6.4%。但是更进一步的时间分配不一样,当求助于人时,用户很快定位到自己想要的信息,因为是其他人有针对性的回答,这样就不会浪费时间在他无关信息上(百度问答);在理解信息上问人和看文档的时间差不多,因为都来自自然语言的描述;但用户如果求助人却要花更多的时间在做决定上。 另外一个他的发现类似80-20原理,用户用了更多的时间去看那些并不是他们最初检索的东西,这也就是为什么,上诉7.8%和6.4%加起来也才14.2%的原因。更有趣的是,人也倾向提供更多并不是那么相关的东西给其他人。(看来答非所问的人还是比较多的,其实也可以提供一些隐式信息)。

    6. 对于信息检索过程比较出名的是Carol Kuhlthau提出来的Information Search Process

      其将一个完整的信息检索过程标准化为6个阶段,每个阶段从4个方面进行分析:Cognitive(thoughts)-用户想要完成什么任务;Affective(feelings)-搜索用户的感觉;Actions(physical)-搜索用户的行为;Strategies(physical)-搜索用户预期得到的信息。(以下部分以后理解清楚后再翻译)

    Stage

    Task

    Thoughts

    Feelings

    Actions

    Strategies

     

     

     

     

     

     

    1

    Task initiation

    Contemplating assignment,   comprehending task, relating prior experience and knowledge, considering   possible topics

    Apprehension of work ahead,   uncertainty

    Talking with others, browsing   library

    Brainstorming, discussing,   contemplating possibilities, tolerating uncertainty

    2

    Topic selection

    Weighing topics against criteria   such as personal interest, project requirements, information available, time   available; predicting outcome of possible choices, choosing topic with   potential for success

    Confusion, sometimes anxiety,   brief elation (after selection), anticipation of task

    Consulting informal mediators,   using reference collections, preliminary searches

    Discussing possible topics,   predicting outcomes of choices, gaining general overview of topic

    3

    Pre-focus exploration

    Becoming informed about general   topic, seeking focus in general information found, identifying possible foci,   inability to express precise information needed

    Confusion, doubt, sometimes   threat, uncertainty

    Locating relevant information, reading   to become informed, taking notes, making bibliographic citations

    Reading to learn about topic,   tolerating inconsistency and incompatibility of information encountered,   intentionally seeking possible focus, listing descriptors

    4

    Focus formation

    Predicting outcome of possible   foci, using stage 2 task criteria, identifying ideas in information to form   focus, sometimes characterised by a sudden moment of insight

    Optimism, confidence of ability to   complete task

    Reading notes for themes

    Making a survey of notes, listing   possible foci, choosing a focus while rejecting others OR combining several   themes to form one focus

    5

    Information collection

    Seeking information to support   focus, defining and extending focus through information, gathering pertinent   information, organising information in notes

    Realisation of extensive work to   be done, confidence in ability to complete task, increased interest

    Using library to collect pertinent   information, requesting specific sources, talking detailed notes with   bibliographic citations

    Using descriptors to search out   pertinent information, making comprehensive search of various types of   materials i.e. reference, periodicals, non-fiction and biography, using   indexes, requesting assistance of librarian

    6

    Search closure

    Identify need for any additional   information, considering time limit, diminishing relevance, increasing   redundancy, exhausting resources

    Sense of relief, sometimes   satisfaction, sometimes disappointment

    Re-checking information for   information initially overlooked, confirming information and bibliographic   citations

    Returning to library to make   summary search, keeping books until completion of writing to re-check   information

     不得不说对于心理学或者人类学的工作者能把这些行为分得如此细致,具体的细微差别蛮有道理还得仔细体会。

    7. 引导者和探索者(Navigators and explorers)

      这种观点是将信息搜索的用户分为两种:经验丰富的用户常常反复访问同一个网站,很少有偏离他们访问目标或者回退的搜索行为,而经验不是很丰富的用户会访问很多不同的域,频繁变更大量的搜索请求。 

    8 JISC研究了Google Generation总结出6种不同的网络信息搜索的行为

    • Horizontal infromation seeker: 浏览一系列网页,不在回到最初的那个网页;
    • Navigation: 主要花时间找周围的路
    • viewers: 电子书或者电子杂志的用户通常平均会花4~8分钟去观看上面的网站
    • Squirreling behavior: 就好像用户下载了很多各种各样的文档,但是一般没有必要去读完这些文档
    • Checking information seekers: 通过访问一些权威网站获得对应信息的确认
    • diverse information seekers: 除其他几种剩下的所有
  • 相关阅读:
    Ubuntu Git GUI工具GitKraken安装
    轻松理解String.intern()
    Ubuntu MySQL安装
    稳定与不稳定的人生(转自知乎)
    【推荐】我们这一代人的困惑
    没关系,因为你是好人呀
    论文--Topic-Sensitive PageRank
    论文笔记-Mining latent relations in peer-production environments
    Open Source Book For ML
    LeetCode-Populating Next Right Pointers in Each Node
  • 原文地址:https://www.cnblogs.com/yxy8023ustc/p/3369892.html
Copyright © 2011-2022 走看看