zoukankan      html  css  js  c++  java
  • GitHub 开源项目文章爬虫,懒人必备!

    hello,小伙伴们大家好

    今天给大家介绍的开源项目是文章爬虫利器

    爱收集的小伙伴们的福利哦!

    假如你在工作中接到产品小姐姐的需求,需求是获取V2EX,知乎,简书,知否(SegmentFault),掘金,CSDN博客,微信公众号文章,cnblogs等中文网站中输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码 转化为Markdown,你会怎么做,假如你 code 功力还没有经过九九八十一天的修炼,还没有练到元婴期,你脑子里应该想的是我要写这么多规则,可怎么办,要累死人呢!要是有一个通用工具就好了,我要分享的这个github的开源项目:

    在线体验地址:在线体验

    项目链接:github

    一键解析Markdown V2EX,知乎,简书,知否(SegmentFault),掘金,CSDN博客,微信公众号文章,cnblogs的页面->解析为markdown

    ToMarkdown

    功能描述: 将HTTP页面 解析为Markdown格式


    目前支持: 知乎,简书,知否(SegmentFault),掘金,CSDN博客,微信公众号,V2EX 一键解析


    体验地址: http://markdown.liangtengyu.com:9999


    后端技术栈:

    1. springboot v2.1.4.RELEASE
    2. Jsoup
    3. Remark

    前端:

    1. axios 请求组件
    2. mavoneditor markdown显示编辑组件
    3. ant-design-vue

    使用方式也特别简单:

    打开地址-->输入文章地址-->点击解析-->完成


    有兴趣的小伙伴可以尝试应用一下,如果在使用期间遇到问题请在下方留言或私信我!

    今天的推荐不知道大家喜欢吗?如果你们喜欢话,请在文章底部留言和点赞,以表示对我的支持,你们的留言,点赞和转发关注是我持续更新的动力哦!

    关注公众号:java宝典
    a

  • 相关阅读:
    第二章IntelliJ IDEA 安装目录的核心文件讲解
    第一章首次运行 IntelliJ IDEA 示例
    struts json ajax整理
    关于struts2文件下载
    mybatis深入资料
    MyBatis获取插入记录的自增长字段值
    好久没有更新博客了,今天更新了几篇
    枚举Enum 的常用方法
    angular js中ng-model时间格式化
    input框输入完回车即可查询事件
  • 原文地址:https://www.cnblogs.com/java-bible/p/14107299.html
Copyright © 2011-2022 走看看