zoukankan      html  css  js  c++  java
  • Beta版本发布说明

    项目名称

    Pipeline

    项目版本

    Beta版本

    负责人

    北京航空航天大学计算机学院 C705团队

    联系方式

    http://www.cnblogs.com/C705/

    发布日期

    2014-12-28

     
    更新内容: 
     1.修复缺陷:
      a)修复了数据库插入异常
      b)翻译功能的更新和优化
     
    2.新功能:
      a)增加对问答对的信息处理
      第二次迭代中,我们积极地同第三组沟通,了解到他们需要实现的核心功能需要我们为他们提供一个新的数据库,这个数据库存放了问答网站的地址以及问题的相关信息。因此我们筛选了六个常用的问答网站(百度知道,搜搜问问,德问,stackoverflow,cnblog,),向爬虫们提出了尽量爬取这六个网站的需求,我们将网站中的有效信息提取出来存入数据库提供给下一组使用。
     
      b)可持续处理数据
      在alpha阶段结束的时候,我们还有一个问题没有解决,那就是如何让这个程序能够绵绵不绝地处理数据库中新爬到的网站,这也是我们整个学霸项目能够运行的重点所在。不负众望,我们做到了这一点,能够不断处理数据库中新添的数据。  
     
    环境要求: 
     

    操作系统需求

    Windows操作系统

    运行环境需求

    数据库需求

    需配置数据库到Windows(或Windows   server)数据源中

     
     
     
     
     
     
     
     
    安装方法:
      直接解压安装,在PipelinePipelineinDebug文件夹中找到Pipeline.exe可以打开程序。
     
    系统已知的问题和限制:
       a)图片信息无法提取
       b)问题时间获取与该提问网站设计有关,可能不够准确
     
    软件的发布方式以及发布地址:
      代码发布在服务器219.224.191.25上,与其他学霸小组整合为学霸网站。
  • 相关阅读:
    python爬虫开发与项目实践-学习笔记(一)
    python之TypeError
    学习笔记-python
    python学习之Unable to locate element
    Chrome浏览器之 webdriver(Chrome version must be >= 63.0.3239.0)
    POJ 1830 开关问题 高斯消元
    HDU 4135 Co-prime 容斥原理
    HDU 1796 How many integers can you find 容斥原理
    卡特兰数,组合数,斯特林数,逆元模板
    HDU 6134 Killer Names 数学 斯特林数
  • 原文地址:https://www.cnblogs.com/C705/p/4189726.html
Copyright © 2011-2022 走看看