采集站的规则怎么写的?
比如图片站采集 新闻采集什么的 规则是怎么写的哦
想学一下 老哥们
tianzi
主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP
都学完了自然就会了
C
C引用主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了
C 主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了
本身就是搞前端的 但是后端Python php没搞过 尴尬
tianzi
可以去学一下火车头采集,它官网也有教程
电击小子
tianzi引用C 主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了 本身就是搞前端的 但是后端Python php没搞过 尴尬
tianzi 本身就是搞前端的 但是后端Python php没搞过 尴尬
搞前端的更容易上手,知道内容在哪个DOM,学一下正则表达式匹配,采集器规则里配置页面URL泛路径,就OK。
具体哪个采集器,得看他们的规则,但大体上都是正则表达式。
C
tianzi引用电击小子 可以去学一下火车头采集,它官网也有教程 老哥你3vku是不是采集的
tianzi 老哥你3vku是不是采集的
我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。
电击小子
电击小子引用tianzi 老哥你3vku是不是采集的 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。
电击小子 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。
老哥站点开始盈利了没有
v2016
v2016引用电击小子 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。 老哥站点开始盈利了没有
v2016 老哥站点开始盈利了没有
在开始盈利了
电击小子