去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。
程序的功能:
1、采集数据
2、可配置的,只要输入一定的条件就能采任何东西了。
3、可导出成csv格式
4、可把数据导入到淘宝助手。
5、采集图片到本地。
6、可修改宝贝内容
7、可使用模板来进行描述
用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。
先看看配置文件:
1
<?xml version="1.0" encoding="utf-8" ?>
2
<configuration>
3
<configSections>
4
<sectionGroup name="userSettings" type="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5
<section name="MyCollection.CollectSetting" type="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition="MachineToLocalUser" requirePermission="false" />
6
</sectionGroup>
7
</configSections>
8
<connectionStrings>
9
<add name="MyCollection.Properties.Settings.MyCollectConnectionString"
10
connectionString="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11
providerName="System.Data.SqlClient" />
12
</connectionStrings>
13
<userSettings>
14
<MyCollection.CollectSetting>
15
<setting name="SaveImagePath" serializeAs="String">
16
<value>D:\办公\淘游馆\香水彩妆\商品图片\</value>
17
</setting>
18
<setting name="SaveCSVPath" serializeAs="String">
19
<value>D:\办公\淘游馆\香水彩妆\描述模板\</value>
20
</setting>
21
<setting name="HtmlTemplet" serializeAs="String">
22
<value>D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html</value>
23
</setting>
24
</MyCollection.CollectSetting>
25
</userSettings>
26
</configuration>
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
2
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
3
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
4
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
5
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
6
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
7
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
8
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
9
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
10
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
11
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
12
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
13
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
14
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
15
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
16
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
17
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
18
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
19
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
20
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
21
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
22
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
23
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
24
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
25
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
26
![](https://www.cnblogs.com/Images/OutliningIndicators/None.gif)
SaveImagePath:保存图片到本地的路径
SaveCSVPath:导出文件所在目录
HtmlTemplet:宝贝描述模板文件
大概的界面:
主界面
显示此项目中的采集的数据
单个商品的详细内容,用的是winform的Edit,感觉还不错。
下面是进行采集的配置,界面如下:
如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。
在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。
在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。
程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P
东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)
PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。
PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(