【前言】虽然一直知道寄生虫怎么做的,但是一直不知其中的奥妙,先几天下载了一套程序,把php源码看了一下,顿时恍然大悟,原来就是这么简单的一个东西~
什么是蜘蛛池程序?
简单来说,就是你输入任意二级域名,任意目录(内页链接 ) 都是可以访问的,且无404~
然后出来的内容完全随机 ( 连标题都随机,这是相当不好的,后面在说 )
然后内页无限链轮,就让搜索引擎不断的抓…
程序也很简单,因为不需要多少代码,只要把域名绑定了就可以了,如果是django的话,其实url只需要这样写就可以了
url(r'^.+?/$', NeiyeView.as_view(), name='neiye'),
这样输入任意的链接都是可以访问的
什么是寄生虫程序?
其实你理解为就是放一个文件到webshell上,
然后这个程序的内容每次访问的时候,随机请求一下我们的蜘蛛池中的一个页面~然后再返回给搜索引擎就可以~其实原理上和蜘蛛池是一样的,只不过多了一个爬虫文件在shell端 ( 这里指的是动态生成的)
目前市面的上的蜘蛛池的缺点是什么?
1.就像刚才说的,内容完全随机~~标题每次都不一样~
所以导致,排名及其不稳定~而且我感觉也特别容易被k~这个我感觉不太好~
2.内容太粗糙,都是简单的拼凑~但是搜索引擎还是会收录~
3.链轮模型不够细致~简单来说就是完全随机~
如果我做的话我会怎么做~
自己不才,写了一个玩具的django版的蜘蛛池~ 没想到技术实现起来这么容易~~
后台大概是这样的 ( django默认的)