《大型网站SEO优化实践》学习分享

本文主要内容源自2013年阿里技术嘉年华中阿里巴巴周文君分享《大型网站SEO优化实践》。学习过后,受益匪浅,特作笔记,经常回顾吸收学习。
大型网站SEO的特点&优势&挑战

特点

页面数量巨大
 
SEO流量高,长尾流量占比大
 
数以百计的Web应用
 
跨团队、多团队协作

优势

页面内容丰富,数量多(UGC)
 
域名初始权重高
 
无需刻意进行link building,用户会主动帮忙进行链接建设和推广
 
网站安全及性能优化由专业团队负责

挑战

用户内容如何更好地匹配用户搜索Query(如:博文、帖子)
 
如何更好的挖掘、整合用户内容,生成更有价值网页
 
SEO优化方案竞彩遭遇用户体验冲突,KPI冲突
 
Web应用SEO定位
 
SEO需结合产品定位及产品核心价值(寻找价值关键词)
 
SEO流量预估(内容特点、页面数量,按照同类产品的索引量与SEO流量比值来进行预估,如:页面数*收录率 : SEO流量 = 200:1 ~ 10:1)
 
注重品牌效应
 
营销活动(营销活动期间做好相关优化,SEO具有时效性)
 

大型网站SEO基本策略

SEO技术研究
seo技术
优化初期三板斧
URL规范化:URL规范化是大型网站SEO优化的根本,解决得是搜索引擎网页库,索引库,URL库中的Key问题。URL规范化影响着网站核心资源被抓取及索引效率,权重等
页面元素优化:页面元素优化决定着未来流量上升的高度;Title&Description,不同的场景,采用不同的模板;H,P,B,Strong标签,图片alt属性,页面无效链接添加rel=”nofollow”等
提升核心资源被抓取效率:优化初期应优先关注收录率,而非排名及流量(70%比较合理)
新URL规范化+robots禁止策略简单粗暴,非常有效
优化中后期应注重的三点
URL规范旧状
URL规范旧状:多域名;全静态化,全动态化,半静态化等多套URL规范;URL层级太深;URL解析代码复杂冗余,性能低,维护成本高。
问题与挑战
参数全静态化,本质还是动态化,SEO效果差;跟前端工程师合作效率低,如:JS拼接静态URL问题;URL中特殊字符解析问题,如%2F(/),%4E(N);form表单提交产生多余的301跳转,增加前端性能负担(20ms左右)。
URL规范化问题对策(搜索引擎)
noidex,nofollow标签;301跳转;canonical标签;webmaster可设置动态参数处理方式
我们如何解决?
提升网站核心资源被爬去效率
引导爬虫抓取网站核心资源:站点扁平结构,实施难,重点优化面包屑;sitemap每日全量更新,补充Spider URL库;页面部分推荐模块异步改同步加载,核心资源URL部署到权重高的页面
减少无效URL的抓取:robots.txt禁止无效URL被抓取及被索引;通过noindex meta标签禁止URL被索引(百度暂不支持);nofollow的使用
提升网站抓取量:避免搜索引擎官方爬虫被安全软件拦截;逐步上调站长平台抓取压力,及时更新死链sitemap
大型网站SEO优化中后期应注意的三点
专注Query分析:Search Query = Search Requirement;用户搜索的query是否match页面Title中的关键词;词库分库分档
调排名:准侧,对排在第二及第三页的关键词,重点分析调优。三页以后的关键词,投入产出比较低
研究anti-spam:坚持白帽,杜绝黑帽;研究anti-spam防止不正确优化被判作弊
全站SEO效果监控
日志分析脚本
定时分析
Email分析报告
图形化报表
统计SEO基本指标数据(分产品线,分搜索引擎)
SEO统计报表
构建傻瓜数据平台
全站SEO效果监控
SEO爬虫分析
SEO收录及反链分析
SEO基本指标统计
排名监控
核心关键词核心应用每日排名
竞争对手排名监控
第三方数据
搜索引擎开放的监控数据:百度站长平台,Google、Bing Webmaster
第三方统计工具
Do Everything with Tools
搜索引擎提供的SEO工具
页面Title&Description优化工具
链接分析工具
流量监控工具
页面诊断分析工具
移动WAP的SEO优化
自主适配:根据user-agent自主适配到WAP页面
标注meta声明:name=”mobile-agent”
开放适配协议:百度站长平台提交开放适配协议,以适配协议为准
Doctype声明:Doctype声明有助于搜索引擎识别该页面是否合适手机浏览。WAP页协议:xhtml/wml/html5
SEO领域体系化建设
SEO领域体系建设
大公司SEO项目合作方式及挑战