怎样用PhantomJS消除AJAX对百度SEO的不利影响
资源介绍
怎样用PhantomJS消除AJAX对百度SEO的不利影响?在看到这个题目的时辰,早读君就想到公司的手游站,全站走ajax。可体现走出的问题即是搜寻引擎不何如鸟你,这点对百度SEO从业者们而言对照致命。对照大部分仍然靠百度来的。今日提到的这个计划很有意思,尽管器材都晓得,可即是没想到还不妨这么玩。
腾讯问卷全部动态内容,全部由Ajax接口提供。
众所周知,大部分的搜寻引擎爬虫都不会实行JS,也即是说,假如页面内容由Ajax退回的话,搜寻引擎是爬取不到部分内容的,也就无从做SEO了。
昨年一全年,搜寻引擎收录都少得可怜。
更致命的是,被收录的页面,其搜寻引擎内部显现的题目是原始的html题目,权重如此高的地方,却被收录了一个没什么用的题目。
在昨年年底完毕实践了预衬托服务后,收录量蹭蹭蹭的起来了,而且收录的题目也都全部正常了。
而这全部的全部,除去Nginx接入层的配置是需求变动业务代码外,其余全部都是旁路机制。也即是说,自身做一套,不妨给全部同类别业务共用,同时不会影响现有业务的任何代码任何流程。
PhantomJS来获救
Ajax无法做SEO这个问题,困惑了百度SEO从业者很久,之后发现PhantomJS这器材能在服务端分析HTML,霎时这个问题不再是问题。
PhantomJS is aheadless WebKit scriptable with a JavaScript API. It hasfast andnative supportfor various web standards: DOM handling, CSS selector, JSON, Canvas, and SVG.
筹划一个PhantomJS使命脚本
这里百度SEO从业者定名为spider.js。
经过PhantomJS号令直接实行能够在终端中看到衬托后的html结构
号令服务化
什么意思呢,因为上面是一个号令,没法很好的反响搜寻引擎爬虫的请求,估百度SEO从业者们要把他服务化。
PhantomJS自带一个Web Server Module,但老是不安稳,如前方文章所说时不断会假死。
百度SEO从业者们就经过Node给他起一个简单的Web服务。
旁路服务
百度SEO从业者们现在依然有了一个能跑预衬托的Web服务了,剩下即是要将搜寻引擎爬虫的流量导入到这个预衬托的服务中,同时把后果再退回给搜寻引擎爬虫。
百度SEO从业者们运用Nginx这个接入层利器能够轻松处理这个问题。
这个栗子内部仅仅对百度爬虫做了处理,不妨自行把爬虫都补完好。
Free
说了这么多,百度SEO从业者忽然觉得这篇文章相当值钱。
因为,海外也有特意的服务端预衬托服务了,但他们统统要收取。
你不妨根据本文的思绪,自行布署一套旁路衬托服务。
转载请注明出处。