文件大小:
软件介绍
水淼文章采集器简介:
水淼软件出品的一款万能文章采集软件,可以只需输入关键字就能采集各种网页和新闻,还可以采集指定列表页(栏目页)的文章。
水淼万能文章采集器特点:
1、文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
2、史上最简单最智能文章采集器,更多特点一试就知!
3、依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
4、可定向采集指定网站栏目列表下的所有文章(如百度经验、百度贴吧),智能化匹配,无需编写复杂规则。
5、只需输入关键词,就能采集到微信文章、今日头条、一点资讯、百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎新闻和网页;可批量关键词全自动采集。
问题集锦:
采集设置的黑名单错误 [采集设置]里面输入黑名单时,如果最后有空行存在,就会导致关键词采集功能有搜索数量显示而无实际采集过程的问题。
特别注意:
微信引擎限制严格,采集线程数请设置为1个,否则非常容易出验证码。
更新内容:
采集文章url,强化相对路径的处理,比如../ 和 ../../ 等,经过本版本强化处理后,相对路径将完全转化为绝对路径,与浏览器中鼠标移到链接上查看到的一致。
修复谷歌改动导致采集失败的问题。
修复关键词采集文章栏目选定精确标签时没有弹出输入的问题(前面版本造成);根据url采集文章栏目新增删除外层代码可选选项(之前默认启用);调试模式更改为文章来源;疑点说明更新;其他。
全新增加正文过滤功能,可以屏蔽掉绝大多数不属于正文的内容;合并严格和标准的正文识别,并强化正文识别能力(现在识别的正文没有再带父层的div标签了,都是取内部的代码了);增强对部分特意伪装的网站标题的提取能力;其他更新。
版权声明:
1 本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!
2 本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。
3 若有关在线投稿、无法下载等问题,请与本站客服人员联系。
4 如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系QQ:2499894784
点击加载更多评论>>