zoukankan      html  css  js  c++  java
  • 自己做的一个小程序 可采集、导出、模板、配置

    去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。

    程序的功能:

    1、采集数据

    2、可配置的,只要输入一定的条件就能采任何东西了。

    3、可导出成csv格式

    4、可把数据导入到淘宝助手。

    5、采集图片到本地。

    6、可修改宝贝内容

    7、可使用模板来进行描述

    用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。

    先看看配置文件:

     1<?xml version="1.0" encoding="utf-8" ?>
     2<configuration>
     3    <configSections>
     4        <sectionGroup name="userSettings" type="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
     5            <section name="MyCollection.CollectSetting" type="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition="MachineToLocalUser" requirePermission="false" />
     6        </sectionGroup>
     7    </configSections>
     8    <connectionStrings>
     9        <add name="MyCollection.Properties.Settings.MyCollectConnectionString"
    10            connectionString="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
    11            providerName="System.Data.SqlClient" />
    12    </connectionStrings>
    13    <userSettings>
    14        <MyCollection.CollectSetting>
    15            <setting name="SaveImagePath" serializeAs="String">
    16                <value>D:\办公\淘游馆\香水彩妆\商品图片\</value>
    17            </setting>
    18            <setting name="SaveCSVPath" serializeAs="String">
    19                <value>D:\办公\淘游馆\香水彩妆\描述模板\</value>
    20            </setting>
    21            <setting name="HtmlTemplet" serializeAs="String">
    22                <value>D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html</value>
    23            </setting>
    24        </MyCollection.CollectSetting>
    25    </userSettings>
    26</configuration>

    SaveImagePath:保存图片到本地的路径

    SaveCSVPath:导出文件所在目录

    HtmlTemplet:宝贝描述模板文件

    大概的界面:

    主界面

    显示此项目中的采集的数据

    单个商品的详细内容,用的是winform的Edit,感觉还不错。

    下面是进行采集的配置,界面如下:

    如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。

    在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。

    在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。

    程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P

    东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)

    点击下载

    PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。

    PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(

  • 相关阅读:
    python 按行读取判断是否为空
    python获取目录下所有文件
    Kolakoski
    最小背包问题
    python 求第k个最大数
    python 求最大子序列
    爬取数据的程序
    文件对比程序
    trsd_extract_EDSD_new
    tred_extract_EDED_new
  • 原文地址:https://www.cnblogs.com/inday/p/1452287.html
Copyright © 2011-2022 走看看