zoukankan      html  css  js  c++  java
  • 织梦入门2-采集1

    文章数据库

    标题在dede_archives里
    内容在dede_addonarticle里

    织梦采集的临时内容在dede_co_htmls表里

    dede_arctiny表存储文章的ID,一般会因为这个表报找不到模版错误

    如果在一件更新的更新所有中报文章ID-模版不存在错误,那就是因为dede_arctiny表对应的dede_archives和dede_addonarticle表内容不存在

    需要删除dede_arctiny表中的ID号

    一般调用数据库中的内容是通过{dede:field.标签名/}来调用的

    节点名称:电影天堂科幻片2
    引用网址:http://www.dy2018.com/4/index.htm
    匹配网站(测试用):http://www.dy2018.com/4/index_(*).html 2-2
    区域开始HTML:<div class="co_content8">
    区域结束HTML:</ul>

    织梦采集时内容区域对空格敏感

    【内容配置】
    预览网址:http://www.dy2018.com/i/97869.html
    匹配规则:<h1>[内容]</h1>
    发布时间:<span class="updatetime">[内容]</span>

    文章内容匹配规则:

    <td colspan="2" align="center" valign="top"><div id="Zoom">
    [内容]
                  </tr>

    过滤规则:[常用规则的表格过滤][脚本过滤][图像过滤][div过滤]

    {dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
    {dede:trim replace=""}<table([^>]*)>(.*)</table>{/dede:trim}
    {dede:trim replace=""}<img([^>]*)>{/dede:trim}
    {dede:trim replace=""}<div([^.]*)>{/dede:trim}
    {dede:trim replace=""}</div>{/dede:trim}

    自定义处理接口:

    @me=str_replace('<td><span style="FONT-SIZE: 12px"><td>',’’,@me);
    @me=str_replace('<div id="contentMidPicAD" style="float:right; clear:both; top:0; vertical-align:top;"><!-- 250x250启用SSP 开始 --><script type="text/javascript">var _mda_place_id ="58bcc82381892";</script><script type="text/javascript" src="http://place.ssp.desdev.cn/pageplace/show.js"></script><!-- 250x250启用SSP 结束 --></div>',’’,@me);

  • 相关阅读:
    合并项目(Project)
    Table.Group分组…Group(Power Query 之 M 语言)
    日程表(Project)
    判断存在…Contains…(Power Query 之 M 语言)
    批量打印本文件夹内除本工作簿以外所有工作簿的第一个工作表
    断舍离与“优秀”推销员
    JS中的let变量
    JavaScript中typeof正确使用
    JavaScript基础学习(一)
    Write an ASP.NET MVC Web app to get Outlook mail, calendar, and contacts
  • 原文地址:https://www.cnblogs.com/wgphp/p/7765961.html
Copyright © 2011-2022 走看看