SEO们常常头疼的一个问题,没有收录、索引就无从谈排名。尤其对到达必然规划的网站来说,使网站充 分收录是个颇令人费心的SEO技能,当页面到达比方说几十万,无论网站架构怎样设计、何等优化,100%收录都是不成能的,只能尽量进步收录率。 但有时分怎样阻止查找引擎收录也能够成为一个问题,比来越来越成为问题。需求阻止收录的状况如保护秘密信息、复制内容、告白链接等。曩昔常用的阻止收录办法包罗暗码维护、把内容放在表格后面、运用JS/Ajax、运用Flash等。今日看到Google网管博客一篇文章,这些办法都不保险。
运用Flash
Google几年前就开端测验抓取Flash内容了,简略文字性内容曾经能抓取。Flash里面的链接也能被跟踪。
表格
Google蜘蛛也能填表,也能抓取POST恳求页面。这个早就能从日记中看到。
JS/Ajax
运用JS链接不断以来被看成不查找引擎友爱的办法,因而可以阻止蜘蛛匍匐,但两三年前我就看到JS链接不克不及阻止Google蜘蛛抓取,不只JS中呈现的URL会被爬,简略的JS还能被执行找到更多URL。
前几天有人发现良多网站运用的Facebook谈论插件里的谈论被爬、被收录,插件自身是个AJAX。这是个好音讯。我的一个实行电子商务网站产物 谈论功用就由于这个费了不少心思,用Facebook comments插件益处大大的,详细什么益处今后有工夫再说,独一的问题就是谈论是AJAX完成的,不克不及被抓取,而产物谈论被收录是目标之一(发生原创 内容)。我那时想了半天也没有处理办法,只好先傻傻地既放上Facebook comments插件又翻开购物车自身的谈论功用。目前好了,Facebook comments里的谈论能被收录,就不必两套谈论功用了。
Robots文件
当前独一确保内容不被收录的办法是robots文件制止。但也有个害处,会流掉权重,固然内容是不克不及收录了,但页面成了只承受链接权重、不流出权重的无底洞。
Nofollow
Nofollow并不克不及包管不被收录。就算本人网站一切指向页面的链接都加了NF,也不克不及包管他人网站不给这个页面弄个链接,查找引擎照样能发现这个页面。
如何使页面不被收录是个值得考虑的问题,没认识到严峻性的童鞋可以想想本人网站上有几多复制内容、低质量内容、各类无查找价值(但用户感觉便利、有效所以又不克不及拿失落)的分类、过滤URL。
更多资讯
- 08-02网页启用Gzip压缩 提高浏览速度
- 07-20如何去做交互设计?交互设计师需要做什么?
- 07-20你不得不打破的惯性思维:用户=上帝
- 06-15产品经理“趟坑”经验,满满都是泪
- 05-02关于IIS进程池出错终止的故障排查手记
- 04-25解决网站打开显示Service Unviable(应用程序池自动停止)
- 04-16IIS v6.0 完整版
- 04-16启动和关闭Apache