前言:
忘记搜索什么词关联到这些展现结果的,如图:
我一看,没看错,确实霸屏了,而且前十页都霸屏了。让我惊讶的不是霸屏而是url,居然不是常见网址类型,也不是ip形式的,恩。。看起来好像是十六进制的样子。百度了一下ip转十六进制的百度经验,还真有:http://jingyan.baidu.com/article/200957617a9e13cb0721b4e5.htm
开始逆向分析:
好吧,那这些转化后的ip是怎么被百度收录的呢,为了找到答案楼主可是翻了很多资料:
首先是服务器方面:
楼主偶然打开他们的一个还没设置好的服务器,看到以下界面:
Apache/2.0.63 (Win32) PHP/5.2.14 Server at 0x00000006b.0x00000a3.000000223.0x000007 Port 80
这一段代表以“0x00000006b.0x00000a3.000000223.0x000007”为服务器,端口80。那么我们可以理解为ip转换之后的十六进制字符。
好吧,基本上这样就算让百度误以为转化之后的十六进制就是解析的地址,然后收录,不做外链为啥收录,请参考帖子:http://ask.seowhy.com/question/12920
我们进行下一步分析,楼主就想了,这丫的作弊耗费的本钱太大了吧,一个页面代表一个ip,楼主点开了很多页面发现是一个c段ip的。楼主的第一想法就是:我靠,居然包了整个c段的服务器。后来一琢磨,其实有的vps有n个ip啊。
ip问题解决了,那么他的页面是怎么做的呢,因为就算是整个c段也才255个嘛,但楼主发现被百度收录的页面起止255个,多是数不清。。。
那是怎么做到的呢?
细心的楼主通过点击这些页面中的一个链接发现:
后面的数字是代表不同的参数吗,不同的参数是不是代表不同的获取页面,经过测试,证明楼主的想法是对的。那么也就是说,一个ip可以有无数个无规律的id页面,那么强大的页面就诞生 了。
楼主看了一下源代码:(注:直接打开右键源代码是看不到的,因为他调用了框架)
发现居然是dz搭建的,丫还居然运用了dz数据化结构,看来真是黑白通杀啊~~
在页面的底部,我们看到了链接:
c段的话 应该不算站群吧。。。反正这个链轮是很强大的说。
后续:
因为使用dz数据结构化,所以百度很友好,强大的链轮模式,和新颖的url,也许就突破了百度当前的算法,做成这样的效果。楼主的一个朋友问楼主,他们这么多为了什么:我想了想,他既然使用各种行业的长尾词做关键词,肯定是想获取巨大流量,这些流量是没有转化意义的,所以也不会去卖什么产品,以当前页面大概是为了做安装量吧!话说这个也很暴力的~
至此,逆向分析结束,也许还没结束,也许楼主太年轻分析的不到位或者哪里说错了,如果有新的发现,此贴会持续更新。
(注:本帖的目的不在教大家怎么作弊,而是通过分析更加了解搜索引擎的算法机制,促进搜索引擎的发展。搜外首发)
请珍惜自己的品牌! 本文质量及原创性由搜外网审核,永久保存。【ID:251】点此查核→