已近深夜了。我还是漫漫的学习中。
首先还是要学学正则的比较哦。
正则表达式的参考地址:http://www.regexlab.com/zh/regref.htm
1.采集内容正则:
‘其实(<content>[\S\s*?])结束’
‘其实(<content>[\W\w*?])结束’
分页的范围,[参数]的使用。
6.8日,我有看了,关于论坛采集的内容。感觉不错。可以采集论坛。但他的模块是收费的。但也给学习火车的人带来了很多帮助。
目前已经成功采集,青年人,中华检验网,med68等网站。采集入库supersite。
期待dedecms的上线运行。