整体的后端流程设计如下
首先是论文的爬取
本系统的主体是论文的一个展示和论文的信息分析
其中论文的爬取工作就是一个关键
论文的爬取选择的pdf文件爬取
pdf文件爬取之后进行文档格式转换
然后对txt文件进行论文文本的操作
其中包括
论文的字段截取
论文的词频统计
论文的主要词汇词云图生成
论文的信息对比