zoukankan      html  css  js  c++  java
  • 寻找与网页内容相关的图片(一) 开放图谱计划

    要想找到网页里那些图片和网页的内容相关绝不是一件容易的事,网页里有各式各样的图片,广告啦、推荐其他网页的缩略图啦、logo等等,可是在与网页相关的图片少之又少。

    过去大家都觉得没必要有文字就足够了,可到了信息大爆炸的时代,面对海量网页,人们早已没有了兴趣。第一个不得不面临这个问题地是社交网站,人们除了自己发微博以外,更多的时候也许只在转微博、分享网页。如果有一张网页的缩略图,便有可能极大提高链接被点击的可能性,进而提高网站的活跃程度(当然这只是瞎想)。

    也不是没可能从网页找到这样一张图片,这需要耗费很大的经历(占用很多CPU),并且不完美,不能保证找到的图片是100%正确。

    于是FACEBOOK最为全球社交网络的老大,提出了开放图谱计划(Open Graph)。在网页的头部,额外加上<meta>标签,来传递网页的关键词、摘要等信息,其中也就包括了一张缩略图。

    <meta property="og:type" content="article" />
    <meta property="og:title" content="将出席博鳌亚洲论坛2015年年会" />
    <meta property="og:description" content="将出席博鳌亚洲论坛2015年年会" />
    <meta property="og:url" content="http://news.sina.com.cn/c/2015-03-19/175331624500.shtml" />
    <meta property="og:image" content="" />
    百科上的说明是这样子的
    Open Graph通讯协定(Protocol)本身是一种制定一套Metatags的规格,用来标注你的页面,告诉我们你的网页代表哪一类型的现实世界物件。另 一伙伴网站,即Amazon旗下的Internet Movie Database(IMDb),将用这个Open Graph Protocol为每一部电影标注页面。按下IMDb上的“赞”按钮,就会自动把那部电影加入Facebook使用者profile中的“最爱的电影”。
    Facebook已和Yahoo、Twitter合作采用OAuth 2.0认证标准。Graph API翻新了Facebook的平台程序代码,让Facebook里的每个物件都拥有独特的ID。通过Open Graph把其他社交网站建构的网络给连接起来,将创造一个更聪明、更与社交连接、更个人化也更具语意意识的网络。
     

    虽然互联网没有国界,很遗憾的是,在中国加入开放图谱计划的,只有最具社交基因的新浪。这也就是说,在中国这种方式行不通。

    这更能说明的是,如果你想要找的与网页相关的图片,网站在这方面绝不会配合你。每一个网站几乎都采用了完全不同的结构来展示文字和图片。如果想要找到一种终极解决方案就只能另寻它法了。

  • 相关阅读:
    Java异常的分类
    Java SE 6 新特性: Java DB 和 JDBC 4.0
    Java SE 6 新特性: 对脚本语言的支持
    面向对象开发方法优点
    RocketMQ之八:水平扩展及负载均衡详解
    Bluetooth 4.0之Android 解说
    iOS截取视频缩略图的两种方法
    Java NIO Buffer
    spark 启动job的流程分析
    C语言堆内存管理上出现的问题,内存泄露,野指针使用,非法释放指针
  • 原文地址:https://www.cnblogs.com/meelo/p/4351444.html
Copyright © 2011-2022 走看看