Home > Misc, Web > 搜索引擎优化(SEO)入门

搜索引擎优化(SEO)入门

September 17th, 2009 Woody Leave a comment Go to comments

原文:Search Engine Optimization 101

你的网站也许是非常好的,但如果没有人找得到,你的网站又有什么用?在这篇关于搜索引擎优化的短文中,我们将看到很多方法可以提高你的网页排名。

作者有话说

在我们开始看这些技巧之前,要明白:不要期望一夜就会有明显成效。通过SEO在搜索引擎中获得较高排名是一个需要长期一丝不苟的坚持才能获得成效的事。不要太急躁,更重要的是,不要使用SEO欺诈手段,这可能会给你带来一时的好处,但长远来看,搜索引擎可能会把你列入黑名单,这显然不是你想要的。慢慢来,严谨认真并且耐心等待结果。

什么是SEO

什么是SEO
SEO,英文Search Engine Optimazation的缩写,是指当人们在搜索某些关键词时,使你的网站出现在搜索结果里排名靠前的位置,从而增加用户的访问量的手段。通常,人们很少去看第二、三页之后的搜索结果。SEO的最好结果是,你的网站出现在搜索结果的第一页,甚至是第一页的第一个结果。当然,要达到这一点,你需要优化并且对页面代码做相应的调整。

选择合适的关键词

选择合适的关键词
在不同的情境中,选择合适的关键可能会很自然,也可能会非常有技巧。你也许想避免那些通用的词汇,因为很难对它们进行优化。应该试着去选择那些含义尽可能明确的词汇,例如,如果你是一个在墨尔本的自由职业者,最佳关键词可能是“墨尔本 自由职业者”或者是“Web 开发 服务 墨尔本”。只有通用的关键字,如“自由职业者”或者“Web开发”,对你的网站不会有任何好处。

仔细研究你的关键词,知道哪些最有可能被人们搜索并且通过搜索结果来到你的网站。

重点关注网站的内容

重点关注网站的内容
一般来说,内容第一,这并不妨碍你用一些技巧使你的网站出现在搜索结果的顶部。你依然需要有充实的内容使得这个好的排名得以保持,否则,如果访问者找不到他想要的东西,那他很快就会离开了。

拥有高质量的、相关的内容是SEO最重要的方面。网站的内容应当对你的网站的用户有用。你需要使你网站的内容易于被读者理解,并且内容需要足够吸引人,使人们愿意下次再来访问。

拥有原创内容也是非常重要的。不要指望仅仅通过从别的网站上复制粘贴一些文字、填充一些关键词然后就可以收工了。带有关键词的原创内容越多越好。假如有人通过搜索“jQuery”来到你的网页,他也会希望看到其他有关于jQuery的内容。在内容页面上添加相关的关键词,但不要想垃圾邮件一样把它们散布的到处都是。关键词应该出现在合适的位置上,并且以合理的频率出现。在内容中填充过多的关键词可能会使你的网站被标记为垃圾站点。

定期更新内容和拥有原创内容同样重要。刚出炉的内容可以带来访问者和搜索引擎的爬虫,这会使你网站的内容更快地被索引到,因此会被搜索引擎更多地收录,返回更多的搜索结果。但也不要为了更新而更新。爬虫对细碎的内容更改并不很感兴趣,只要让访问者能得到新鲜的内容就行。

准备一个合适的域名

准备一个合适的域名
这一点比较难做到。如果可能,域名最好是由关键词组成。例如 www.webdevelopmentaustralia.com 要比 www.somecompany.com 在搜索引擎中获得更高的权重。然后得到一个合适的域名不是件容易的事。

关键词作为域名一部分的域名,看上去不太好看,但要记住域名里的关键词占有很大的权重。

使用友好漂亮的URL

使用友好漂亮的URL
采用将参数作为查询字符串附加到URL后面的那种URL方案,会对搜索引擎爬虫的抓取造成一定的困难。更重要的是,当你把Session ID写在URL中时,等于是为每个Session(会话)创建单独的URL,而这些URL页面几乎是完全相同的内容。这可能会使你因为重复内容而受到惩罚,关于这一点后面还会提到。

可读性好、爬虫容易解析的URL通常好玩传统的带有很多参数的URL。例如 www.somecompany.com/games/2009/callofduty6 优于 www.somecompany.com/index.php?cat=game&year=2009&name=callofduty6。 设计 URL 时应该避免年、月、日这样的部分。例如 www.somecompany.com/blog/seobasics 就比 www.somecompany.com/blog/2009/09/09/seobasics 要好一些。

网页标题与网页内容相关

网页标题与网页内容相关
title标签中的文字显出在浏览器的标题栏里,几乎被排除在页面上重要的元素之外,事实上我敢说它是除了内容之外的最重要的部分。

确保标题是唯一的并且包含了相关的关键词。至于标题部分的结构,“页面标题 -> 网站名”要比“网站名 -> 页面标题”好得多。没有理由让标题限制为很少的字符数,但另一方面,也不要让它太长。60个字符以内是可以接受的。

另外,可以在标题文字中使用关键词,但要注意不要太多。如果爬虫看到了太多的关键词,你的网站可能会被标记为垃圾网站。记住,标题文字会出现在搜索引擎的结果页上,你需要传达出尽可能多的信息。

调整Meta元素

调整meta元素
很久以前,在搜索引擎的爬虫还并不怎么聪明的年代,meta元素发挥了重要的作用。description和keywords这两个meta属性用来帮助搜索引擎分析网页的内容。然后当它们被垃圾网站滥用后,搜索引擎降低了meta元素的重要性。

说到这里,应该指出包含meta description元素并没有什么害处,这其实是用来描述你的网站的一段简要文字。试着将description的文字限制在200个字符以内,保持简洁、语法正确并且含有相关的关键词。让每一个页面都有独特的description描述。

优化页面结构

优化页面结构
网页布局多种多样,边栏和导航栏也没有固定的位置。但一谈到页面内部的HTML,一个原则是最好将主要内容部分放在离body标签尽可能近的地方。如果有其他元素必须要出现在主要内容之前,则应该使用CSS定位技术,而不是直接将这些元素的HTML代码移动到主要内容的前面。

页脚部分很适合放一些指向网站其他页面的链接。不要忽视它,可以在这里放一些相关或者是热门内容的链接,但也不要在这里堆砌太多没多大用处的链接。

使用恰当的HTML标签

使用恰当的HTML标签
开发一个站点时应该使用恰当的HTML标签。标题标签(h1 … h6)使用很广泛,但人们却用通用的div标签来包含一些重要的信息。这其实是错误的做法,如果只看HTML源代码,标题标签可以使我们容易看清楚页面的信息层次结构,这对搜索引擎的爬虫也是一样的道理。例如使用h1表示整篇文章的标题,h2表示每一节的标题等等。

如果你想包含一些代码,应该用pre标签;如果你认为某些信息很重要,请把那些文字标记为粗体字。爬虫会把粗体部分赋予更高的价值(权重),这和我们人类的感觉是一致的。和前面的那些技巧一样,应该有节制地使用这一特点,毕竟你不希望自己的网站被认为是垃圾站点。

精心对待链接

精心对待链接
创建链接时,应该尽力避免使用通用的文字,如“简介”,对搜索引擎不够友好。而是应包含被链接页面的标题上的文字,这并不像听上去的那么困难。例如:使用“read more about SEO”而不是仅仅用“read more”。这样做不会花多少时间,但会获得许多SEO上的好处。

当在你的网站上链接一个页面时,应使链接文字容易被关注。“Portfolio”的效果要好于“What I’ve Done”,尽管后者看上去更容易让人记住,但前者更有利于SEO。

内部链接

内部链接
不要担心在你的网站上创建内部链接。如果页面数量很少,可以在导航条上加上所有页面的链接;如果你的网站很大,有很多的页面,刚可以把一些主要的分类页面链接放在导航条上。无论用哪一种方法,一定要确保所有的网页都可以通过链接找到。

从另一个角度想,你可以很容易地在每一个页面上都包含一个热门内容的区域,通过这种方式你既得到了内部链接,也让你的访问者在你的网站上看到了更多的热门内容。这是一个双赢的结果。

让你的网站更易于访问

让你的网站易于访问
记住,搜索引擎的目的是为了把人带到网站上去,这意味着你的网站应该主要为人的阅读而设计,要时刻记住这一点。

给你的网站上所有的图片都加上alt属性,包含和图片相关的恰当的关键词描述,这不仅是一个好的习惯而且如果你想通过W3C有效性验证,这也是必须要做到的。记住搜索引擎爬虫并不能理解图片上的内容,也不能判断图片是否和网页上的内容相关。恰当的alt描述可以帮助搜索引擎。如果前面的技巧一样,不要过度使用alt属性,应该使alt中的文字描述简明扼要。

不要把内容藏在Javascript或者Flash里,大多数爬虫不能获取到这些地方的内容。没有内容就是网站的失败,避免这种做法,除非你绝对需要那样做。

避免重复内容

避免重复内容
Google对重复内容限制很严,并且对制造重复内容的网站予以严厉的惩罚,无论重复内容是否出现在不同的域名上。如果完全一样的内容出现在不同的页面上,最后被索引的页面将会受到惩罚。

不要让每个页面都是相同的内容,这差不多是常识了。页脚处的文字可以相同而不受惩罚,但页脚的文字不要太多,以至于实际成了主要的内容。

此外,你的网站可能会生成大量的用于打印输出的页面,这些页面可能被搜索引擎发现并当作重复内容。遇到这种情况,请使用robots.txt来阻止搜索引擎收录这些页面。

使用robots.txt

使用robots.txt
创建一个robots.txt文件来允许/阻止爬虫访问你的网站的某些部分。你只需创建一个名字为robots.txt的文本文件,并把它放在网站的根目录下,爬虫就会遵守你在文件中指定的规则。

利用robots.txt,你可以阻止所有的爬虫访问网站的某个目录,也可以只阻止特定搜索引擎的爬虫。这里有关于robots.txt的更多信息。

创建Sitemap

创建Sitemap
Sitemap(站点地图)可以使搜索引擎更容易地找到网站上的各个页面。理想情况是,你应该给你的用户创建一个HTML格式的Sitemap同时为搜索引擎创建一个XML格式的Sitemap,如果可能,将它们链接在一起。

避免框架型网页

避免框架型网页
无论从Web开发的角度还是从搜索引擎的角度来说,框架(frame标签)都是邪恶的,这个再怎么说都不过分。框架里的内容搜索引擎实际上是看不到的。

更糟的是,即使一个框架页面被收录了并且出现在搜索结果里,搜索引擎只是将用户带到这个单独的页面上去,不会包含上一层的框架。框架容易让人产生困惑,并且妨碍搜索引擎抓取你的网站。因此除非绝对必要,否则不要使用框架。

精简页面代码

精简页面代码
就上面这段代码说两个问题:

把JavaScript和CSS都分离到各自的文件中去。爬虫不会理会它们,而且把它们从核心HTML代码中移除也是最佳实践。创建独立的文件,等到需要用的时候再包含进来。

不要使用表现型的标记。这不仅对SEO友好,也是页面编码的最佳实践。HTML标签没有定义内容如何展示,类似地,搜索引擎爬虫也没有理由去知道你的网站看上去是什么样子。在CSS里安排页面以使它符合你的心意,让HTML保持纯净。

不要仅仅使用Flash做导航

不要仅仅使用Flash做导航
这是常识,然后很多设计师和开发者仍然忽视了这一点。爬虫并不能抓取Flash中的内容,如果唯一的导航元素是用Flash做的,那爬虫就不可能通过导航抓取其他页面了。

如果你的整个网站都是基于Flash的,则应为爬虫创建一个纯文字的版本以便抓取内容。这会花费一些额外的时间,但如果没有文字版本可供依赖,你的网站对搜索引擎来说事实上是不可见的。

使用通用的域名方案

使用通用的域名方案
定下一下通用的域名方案后就可坚持下来。我个人喜欢www.somename.com这样的形式但其他人可能喜欢http://somename.com这样的格式。采用一种方案就要坚持使用它。用这一种格式的URL链接网站上的其他网页。

另外要决定URL末尾是否有斜线。搜索引擎认为www.somename.com/seo和www.somename.com/seo/是两个不同的URL,你可以会因为重复内容而受到惩罚。要避免这种问题,需要修改.htaccess文件,使用301重定向功能来统一URL,告诉爬虫页面地址已经被永久移动了。

提交网站

提交网站
如果你的网站是新建的并且还没有被搜索引擎收录,将网站提交到搜索引擎和分类目录是个不错的主意。这不仅会让搜索引擎更早收录你的网站,也会带来大量的新流量和反向链接。

检查损坏的链接

检查损坏的链接
没有什么能像首页上的坏链接一样阻止爬虫抓取你的网站。彻底检验是否有损坏的链接,确保爬虫在抓取网站时有一个开始的地方。

创建一个合适的404页面,以应付搜索引擎将访问者带到一个旧的URL上的情况。错误页面上应该包含合适的链接。

从同类网站获得链接

从同类网站获得链接
这是会花费你大量时间的一大步骤。理想情况下,你希望有很多网站链接到你的网站和你的文章。每个指向你网站的链接都会被当作其他网站给你的投票。从其他同类网站上得到链接是非常重要的,因为目前评价网页的标准正是依赖于这个网页有多少同类站点的反向链接。

不幸的是,这是一项长期的、艰苦并永无止境的任务,并且只有一样东西可能保障你实现它:高质量的内容。提供高质量的内容,这样其他网站会主动链接到你的内容上,链接你的网站越多,你的排名也就越靠前。

不要采用非法手段取得到反向链接,包括链接买卖等等。这些做法会让你很快出局。可行的方法是和其他网站互相建立链接。

我更喜欢的方法是为Net Tuts写文章。我写的每一篇文章里都有一个指向我的链接。Net Tuts越好,我的网站排名也就越好,给我带来很多的新访问者。

使用合适的工具

使用合适的工具
Google Analytics这类的工具可以帮助你分析很多数据,包括你的流量来源、被访页面、用户在每页停留多长时间、访问多少页等等信息。用这些数据可以优化你的网站。

不要忘了Google网站管理员工具。它会让你看到哪些关键字给你带来流量,以及爬虫在抓取你的网站时是否遇到错误,哪些网站链接到你的网站。这些都是你在做优化时的无价之宝。

不要使用“黑帽”手段

不要使用非法手段
不要试图欺骗,这个怎么强调都不过分。如果你这样做,迟早你会被清除出局,并且再也没有第二次机会。这也包括一些听上去合法的技术,像链接买卖、关键词作弊等等。

不要去尝试!

等待结果

到这一步,可以说万事俱备,唯一要做的还是坐下来,创造一些有质量有特色的内容然后等待排名的提升。要耐心,这不会一夜见效,但只要坚持,就一定会有成效。

继续学习

以上这些不过是搜索引擎优化的冰山一角,这里有一些继续学习的资源链接:
Wikipedia
Google guidelines
Yahoo guidelines
Bing guidelines

Categories: Misc, Web Tags: ,
  1. September 21st, 2009 at 08:46 | #1

    个人博客也是要靠口碑效应的