谈谈鲜为人知的搜索引擎细节——做标题,描述预览生成器后感

做这个标题描述预览生成器的时候,一路顺风顺水的,因为这东西技术含量不高,但有点麻烦的是,我一开始就定义要把主流搜索引擎的结果全部做出来,所以得轮番在各个搜索引擎间轮换着观察结果中细微的差别(各位看官看源代码中我写的css就知道了),但也多亏了这个过程中,让我发现各个搜索引擎在哪怕是单条结果上的用心良苦.下面就让我来介绍下我的一些发现。

细节一:一般我们以为搜索引擎对标题和描述是利用定义多字节字符串最大长度(PHP中为mb_strlen函数,excel可以用lenb函数)来做截断的,而标题字段的确如此(更新:如果细心的同学去搜索和统计的话,会发现标题也并非如此,比如有些结果的标题实际计算出来会比我们预想的最大字符数多1-3个字符长度,这种情况是因为搜索引擎使用的是UTF-8编码,而UTF-8在对待中文上3个字符长度才组成1个中文,GBK类编码则是2个字符长度组成1个中文,所以为了保证一个完整的中文字符不被硬生生截断而变成乱码,搜索引擎通常会对文字截断上预留几个字符做缓冲),但描述字段则完全不是这回事了。事实是描述字段不是按照固定的字符串长度而是字符宽度来进行截断的,也就是说不管你描述字段中字有多少,最长单条SERP中显示的描述字段一定是不超过两行!在这两行内字符几乎是有多少展示多少,当然由于两行的限制,所以字符串长度也会有个上限,大概在150-160之间,最长我观察到的为163。百度对于自己抽取并组织到SERP中的描述,长度限制在最多150。

之所以会有上面的结果,是因为各个搜索引擎在截断描述甚至是URL都运用了一定的语义分析,而绝不是简单的凭借字符串长度进行一刀切,毕竟可想而知的是那样的体验会相当的糟糕。而google牛逼就牛逼在中文搜索领域的URL细节上都表现的相当出色。比如我们在百度以及google中文上搜索“机械 site:cn.made-in-china.com”

【本篇文章来自道哥博客http://www.seodug.com/,您看到的可能只是采集的结果,原主题会不断更新以提供高质量的内容,如果您想看到更多100%原创,高质量,一线实战SEO的分享和分析请到道哥博客http://www.seodug.com/】

我们对比中国制造网中文站在这两个搜索引擎上第一个结果的url字段显示:
google中的url为:cn.made-in-china.com/…/Machinery…
baidu中的url为:cn.made-in-china.com/quick-products/…

对于中文搜索用户,尤其是不懂英文的用户而言,这两个url基本可以无视,但是对于英文搜索用户而言,很明显前者的用户体验不止高了一个档次。这也就是为什么google敢于将URL提到description的上方来进行展示的一个重要原因。所以百度如果进军英文,一下就被完爆了。百度的URL截断就是单纯的凭长度一刀切,甚至连bing和yahoo都不如。

【12/04补充,google中英文版对于标题的处理同样也是按照字符宽度来进行截断的】

举个例子,为了更直观,我们打开http://www.google.com/ncr,然后搜索”led street light repair”

对比这两条结果:

谈谈鲜为人知的搜索引擎细节——做标题,描述预览生成器后感 SERP1

谈谈鲜为人知的搜索引擎细节——做标题,描述预览生成器后感 serp2

很明显,上面的两个title都被截断了。但是不同的是,由于大写英文体积比较大,实际展示的字符串长度上,结果1为70,而结果2为52。好了,看到这里做英文SEO的应该就了解了吧,哪怕是大小写也是有区别的。

细节二:百度对于所有的中文逗号会一律转义成英文逗号在SERP中加以展示,而其他的中文标点不会强制转换。所以中文网站还是自觉使用英文逗号以便在百度搜索结果的描述中露出更多内容。

细节三:google更倾向于展示URL中的域名以及最后一个目录或者文件名,截断中间的目录等内容。而且,对最后一段基本会原封不动的全部展示出来,所以夸张的如下面这么长的URL都有。。。好吧,如果想要多占版面的话你懂得。。。

www。treehugger。com/…/foroba-yelen-portable-led-street-light-locally-made-rural-mali-photos.html

细节四:google的采集得先访问google首页,然后才能进行目标SERP的采集(知道RT中的“先访问搜索引擎首页”选项的作用了吧)

细节五:目前只有baidu,google,yahoo,bing会对url进行加粗。而yahoo索性会对url中的域名部分进行加粗

细节六:bing是8条搜索结果


5 thoughts on “谈谈鲜为人知的搜索引擎细节——做标题,描述预览生成器后感

  1. bing貌似每次展示的结果数有点随机,我搜索了下,一次展示9个(总共只有9个结果),一次展示11个(搜索结果>1000)

    • 嗯,首先我这里指的是英文bing。其次结果并不随机,你数的结果数量有波动是bing在SERP中加入了开放平台数据的结果,比如你在bing英文版搜索new york city,其中Images of new york city,还有new york city travel guide这种都是开放平台数据的结果,而真实参与排名的网页是固定的8个。通俗点说如果百度的开放平台算是占着茅坑又拉屎的话,bing就是占着茅坑不拉屎的。具体你看一下源代码就清楚了哈,:P

  2. Pingback: 百度取消SERP中目标网站URI的展示_排名质量分体系_道哥谈SEO技术

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>