采集站的规则怎么写的?

比如图片站采集 新闻采集什么的  规则是怎么写的哦

想学一下  老哥们

tianzi

主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP

都学完了自然就会了

C
C
引用
主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了
C 主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了

本身就是搞前端的  但是后端Python php没搞过 尴尬

tianzi

可以去学一下火车头采集,它官网也有教程

电击小子
tianzi
引用
C 主要学几样东西:HTML/DOM,正则表达式,一门编程语言比如PYTHON或PHP 都学完了自然就会了 本身就是搞前端的 但是后端Python php没搞过 尴尬
tianzi 本身就是搞前端的 但是后端Python php没搞过 尴尬

搞前端的更容易上手,知道内容在哪个DOM,学一下正则表达式匹配,采集器规则里配置页面URL泛路径,就OK。

具体哪个采集器,得看他们的规则,但大体上都是正则表达式。

C
电击小子
引用
可以去学一下火车头采集,它官网也有教程
电击小子 可以去学一下火车头采集,它官网也有教程

老哥你3vku是不是采集的

tianzi
tianzi
引用
电击小子 可以去学一下火车头采集,它官网也有教程 老哥你3vku是不是采集的
tianzi 老哥你3vku是不是采集的

我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。

电击小子
电击小子
引用
tianzi 老哥你3vku是不是采集的 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。
电击小子 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。

老哥站点开始盈利了没有

v2016
v2016
引用
电击小子 我这个没有采集,手工整理的!采集的话文件存储链接都是别人的,不利于付费。我这图片也是单独使用的图床。 老哥站点开始盈利了没有
v2016 老哥站点开始盈利了没有

在开始盈利了

电击小子
1