zoukankan      html  css  js  c++  java
  • JAVA xml RSS

    Google 快讯是根据您的查询以电子邮件形式提供的最新相关 Google 搜索结果(网页、新闻等)的更新。
    http://www.google.com/alerts?hl=zh-cn
     
    http://lindows.iteye.com/rss
     
    http://www.linuxpk.com/rsswww.php
    http://s*****shop.com/s*****/pages/jsp/rss/rss_index.jsp
    商品类别 http://www.s*****shop.com/s*****/rss/cagtegory.xml
    商品品牌 http://www. s***** shop.com/ s***** /rss/brand.xml
    商品列表 http://www. s***** shop.com/ s***** /rss/product.xml
     
     
    http://www. s*****.cn/sitemap.txt
    http://www.s*****.cn/webapp/wcs/stores/servlet/ProductDisplay?langId=-7&storeId=10052&catalogId=10051&productId=20502
    http://www. s***** .cn/sitemap.xml
     
    <urlset>
    <url>
    <loc>
    http://www.s*****.cn/webapp/wcs/stores/servlet/ProductDisplay?langId=-7&storeId=10052&catalogId=10051&productId=20502
    </loc>
    <lastmod>2009-11-11</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
    </url>
    </urlset>
     
     

    http://blog.csdn.net/DarkXie/archive/2006/03/03/614492.aspx

     

    libs:

    http://sourceforge.net/project/downloading.php?group_id=71153&use_mirror=nchc&filename=rsslibj-1_0RC2.jar&6394548

    http://user.qzone.qq.com/170475387/blog/1206341440
    RSS
    1.       RSS  RSSReally Simple Syndication (简易供稿),是某一站点用来和它站点之间共享内容的一种简易方式,也叫聚合内容。RSS ,原意是把网站内容如标题、链接、部分内文甚
    至全文转换为可延伸标示语言(XMLeXtensible Markup Language) 的格式,以向其它网站供稿。
    2.       RSS 的历史最初的0.90 版本RSS 是由Netscape 公司设计的,目的是用来建立一个整合了各主要新闻站点内容的门户,但是0.90 版本的RSS 规范过于复杂,而一个简化的RSS 0.91 版本也随着Netscape 公司对该项目的放弃而于2000 年暂停。
    不久,一家专门从事博客写作软件开发的公司UserLand 接手了RSS 0.91 版本的发展,并把它作为其博客写作软件的基础功能之一继续开发,逐步推出了0.920.930.94 版本。随着网络博客的流行,RSS 作为一种基本的功能也被越来越多的网站和博客软件支持。
    UserLand 公司接手并不断开发RSS 的同时,很多的专业人士认识到需要通过一个第三方、非商业的组织,把RSS 发展成为一个通用的规范,并进一步标准化。于是2001 年一个联合小组在0.90 版本RSS 的开发原则下,以W3C 新一代的语义网技术RDFResource Description Framework )为基础,对RSS 进行了重新定义,发布RSS1.0 ,并将RSS 定义为“RDF Site Summary ”。但是这项工作没有与UserLand 公司进行有效的沟通,UserLand 公司也不承认RSS 1.0 的有效性,并坚持按照自己的设想进一步开发出RSS 的后续版本,到20029 月发布了最新版本RSS 2.0UserLand 公司将RSS 定义为“Really Simple Syndication ”。
    目前RSS 已经分化为RSS 0.9x/2.0RSS 1.0 两个阵营,由于分歧的存在和RSS 0.9x/2.0 的广泛应用现状,RSS 1.0 还没有成为标准化组织的真正标准。
    3.       RSS 用途订阅BLOG(BLOG 上,你可以订阅你工作中所需的技术文章;也可以订阅与你有共同爱好的作者的日志,总之,BLOG 上你对什么感兴趣你就可以订什么)
    订阅新闻( 无论是奇闻怪事、明星消息、体坛风云,只要你想知道的,都可以订阅)
    你再也不用一个网站一个网站,一个网页一个网页去逛了。只要这将你需要的内容订阅在一个RSS 阅读器中,这些内容就会自动出现你的阅读器里,你也不必为了一个急切想知道的消息而不断的刷新网页,因为一旦有了更新,RSS 阅读器就会自己通知你!
    4.       RSS 版本RSS 的版本有很多个,0.900.910.920.930.941.0 2.0 。要理解它们需要了解一些有关它们的历史背景。最初Netscape 创建了RSS 的最初版本0.90 ,起初的名字是“RDF Site Summary ”或者“Rich Site Summary( 规范中说前者是正式名称)Netscape 创建RSS0.90 用于其Web 门户,这个时候,其他人看到了RSS 的使用潜力。Userland Software 是第一个开始将 RSS 用于其网志商业产品者之一。
    版本 0.90 在很大程度上基于 W3C Resource Description Framework (RDF) 。许多人都认为 RDF 过于复杂,因此都建议出一个免费的简化版本 0.91 。这个任务恰好就给了 Userland SoftwareUserland Software 便继续发展 RSS 的简化版本,随后出台的版本包括:0.920.93 0.94 。为了强调其所做的简化工作,他们将 RSS 的全称定为“Really Simple Syndication ”。
    正当Userland Software 继续专注于其简化工作时,另外一组开发人员在复兴最初的RDF 版本(0.90 ),因为RSS 号称自己更灵活。他们最终发布了一个RSS 1.0 的版本,其正式名称还是“RDF Site Summary ”。由于使用RDF ,这个版本完全不同于 Userland Software 所控制的版本。Userland Software 当然不太愿意看到RSS 1.0 似乎要取代其0.94 版本的事实,于是出了一个新版本,并将版本号一下子跳到了2.0
    这就是今天的这种局面,形成了两个主要的竞争版本:一个基于RDF1.0 ,而另一个则是由Userland Software 所开发的2.0 ,由于它们两个都共用相同的名字。就成为一种可怕的混乱,因为版本号导致人们误认为2.01.0 的改进版本,而实际上它们是两个目标完全不同的规范。现在,另一组开发人员已经下狠心着手解决这种混乱问题,通过定义新的摘要(syndication) 规范来与 RSS 名字的随意性决裂。这个解决方案称为 Atom (原子)项目
    5.       RSS 规范RSS 文件由一个 <channel> 元素及其子元素组成。除了频道内容本身之外,<channel> 还以项的形式包含表示频道元数据的元素——比如 <title><link> <description> 。项通常是频道的主要部分,包含经常变化的内容。
    5.1.      频道频道一般有三个元素,提供关于频道本身的信息:
    <title> :频道或提要的名称。
    <link> :与该频道关联的 Web 站点或者站点区域的 URL
    <description> :简要介绍该频道是做什么的。
    许多频道子元素都是可选的。常用的 <image> 元素包含三个必需的子元素:
    <url> :表示该频道的 GIFJPEG PNG 图像的 URL
    <title> :图象的描述。当频道以 HTML 呈现时,用作 HTML <image> 标签的 ALT 属性。
    <link> :站点的 URL 。如果频道以 HTML 呈现,该图像作为到这个站点的链接。
    <image> 还有三个可选的子元素:
    <width> :数字,表示图象的像素宽度,最大值是 188 ,默认值为 88
    <height> :数字,表示图象的像素高度。最大值是 400 ,默认值为 31
    <description> :包含文本,在呈现时可以作为围绕着该图像形成的链接元素的 title 属性。
    5.2.      项项通常是提要中最重要的部分。每个项都可以关于某个 weblog 、完整文档、电影评论、分类广告或者任何希望与频道连锁的内容的记录。频道中的其他元素可能不变,但项经常发生变化。
    您可以有任意多个项。以前的规范限值为 15 个项,如果要保持向后兼容这仍然是一个很好的上限。
    新闻项的元素
    每个项通常包含三个元素:
    <title> :这是项的名称,在标准应用中被转换成 HTML 中的标题。
    <link> :这是该项的 URLtitle 通常作为一个链接,指向包含在 <link> 元素中的 URL
    <description> :通常作为 link 中所指向的 URL 的摘要或者补充。
    所有的元素都是可选的,但是一个项至少要么包含一个 <title> ,要么包含一个 <description>
    项还有其他一些可选的元素:
    <author> :作者的 e-mail 地址。
    <category> :支持有组织的记录。
    <comments> :关于项的注释页的 URL
    <enclosure> :支持和该项有关的媒体对象。
    <guid> :唯一与该项联系在一起的永久性链接。
    <pubDate> :该项是什么时候发布的。
    <source> :该项来自哪个 RSS 频道,当把项聚合在一起时非常有用。
    5.3.      例子清单 1. 示例 RSS 2.0 文件
    <?xml version="1.0"?>
    <rss version="2.0">
       <channel>
       <title>The channel's name goes here</title>
       <link>http://www.urlofthechannel.com/</link>
       <description>This channel is an example channel for an article.
       </description>
       <language>en-us</language>
       <image>
         <title>The image title goes here</title>
         <url>http://www.urlofthechannel.com/images/logo.gif</url>
         <link>http://www.urlofthechannel.com/</link>
       </image>
       <item>
         <title>The Future of content</title>
         <link>http://www.itworld.com/nl/ecom_in_act/11122003/</link>
         <description> The issue of people distributing and reusing
         digital media is a problem for many businesses. It may also be
         a hidden opportunity. Just as open source licensing has opened
         up new possibilities in the world of technology, it promises to do
         the same in the area of creative content.</description>
       </item>
       <item>
         <title>Online Music Services - Better than free?</title>
         <link>http://www.itworld.com/nl/ecom_in_act/08202003/</link>
         <description>More people than ever are downloading music from
         the Internet. Many use person-to-person file sharing programs like
         Kazaa to share and download music in MP3 format, paying nothing.
         This has made it difficult for companies to setup online music
         businesses. How can companies compete against free?</description>
       </item>
    </channel>
    </rss>
    6.       使用RSSLibJ 进行RSS 开发使用RSSLibJ 函数库,rsslib.jar exml.jar
    6.1.      代码public static void main(String[] args)
           throws InstantiationException, ClassNotFoundException,
           IllegalAccessException {
                  Channel channel = new Channel();
                  channel.setDescription("This is my sample channel.");
                  channel.setLink("http://localhost/");
                  channel.setTitle("My Channel");
                  channel.setImage("http://localhost/",
                  "The Channel Image",
                  "http://localhost/foo.jpg");
                  channel.setTextInput("http://localhost/search",
                  "Search The Channel Image",
                  "The Channel Image",
                  "s");
                  channel.addItem("http://localhost/item1",
                  "The First Item covers details on the first item>",
                  "The First Item");
                  channel.addItem("http://localhost/item2",
                  "The Second Item covers details on the second item",
                  "The Second Item");
                  System.out.println("The feed in RDF: " + channel.getFeed("2.0"));
           }
    6.2.      输出:The feed in RDF: <rss version='2.00'>
      <channel>
        <title>My Channel</title>
        <link>http://localhost/</link>
        <description>This is my sample channel.</description>
        <docs>http://backend.userland.com/rss</docs>
        <generator>RSSLibJ (http://rsslibj.sourceforge.net/)</generator>
        <image>
          <title>The Channel Image</title>
          <link>http://localhost/</link>
          <url>http://localhost/foo.jpg</url>
        </image>
        <textInput>
          <title>The Channel Image</title>
          <link>http://localhost/search</link>
          <description>Search The Channel Image</description>
          <name>s</name>
        </textInput>
        <item>
          <title>The First Item</title>
          <link>http://localhost/item1</link>
          <description>The First Item covers details on the first item&gt;</description>
        </item>
        <item>
          <title>The Second Item</title>
          <link>http://localhost/item2</link>
          <description>The Second Item covers details on the second item</description>
        </item>
      </channel>
    </rss>
  • 相关阅读:
    对软件未来走向的看法
    ubuntu:configure error:cannot find ssl libraries
    linux CentOS普通用户无法从ssh登录解决方案
    Can't locate IPC/Run.pm in @INC
    我也学erlang(一)
    我也学erlang(二)
    我也学erlang(四)
    第一篇献给church(丘奇)
    出现epoll failed: Bad file descriptor的原因
    最近看代码的一点总结
  • 原文地址:https://www.cnblogs.com/lindows/p/14390577.html
Copyright © 2011-2022 走看看