最近做的一个功能,一个静态页面上有很多需要翻译,需要替换的文本,由于网站上有翻译界面,只需做个关键词入库操作即可, 所以简单写了几句代码,代替人工操作。
1.通过http爬取网页html,然后正则匹配标签内的文本,添加到集合
2.遍历集合做入库操作
循环插入的性能不好,应该用批量插入的做法,不过数据不多,就没整那么复杂了。