在百度SERP出图的注意点

和百度官方确认了下,原理是如果想要自己的页面在百度SERP中出图则一定要保证robots.txt中没有对Baiduspider-image做封禁,事实是如果对Baiduspider-image封禁了的话,百度会使用Baiduspider/2.0来抓图片,但是如果你连Baiduspider 2.0都封禁了的话,那就bye bye了。 问题是有些网站(尤其是自建cdn服务器的网站)的图片会放在云存储上,站长会利用src来引用。这个时候就一定要注意外链服务器域名的robots.txt文件,有些黑心云存储提供商为了降低服务器宽带负载会对所有爬虫做禁止抓取,后果自然是呵呵了。 这里推荐下七牛… 阅读全文

【0417更新】百度取消SERP中目标网站URI的展示

【0417】百度再次更新了URL摘要的规则,现在展示的字数,竟然是不规则的,如果域名名字很长的话就。。。   【0402】下面的内容经和百度官方确认为BUG 今年百度网页搜索继SERP ajax化之后的又一大动作就是取消SERP中目标网站URI的展示。我曾经在以往的文章中分析及对比过百度与google在URL截断上的努力和尝试,但万万没想到的是百度昨天竟然自暴自弃,完全砍掉了URI的展示。至此百度成了唯一一个不展示URI的SE,真是前无古人的“创举”,鉴于360的屁颠跟风风格(360曾经学习百度做中转页跳转到目标网页,但是结果一坨屎,甚至还导致了360流量在约半月的… 阅读全文

新版GA配置跨顶级域跟踪的方法

新版GA(universal analytics)最大的利好消息是跨域追踪简便化,尤其是跨顶级域的追踪配置变得出奇的方便。 但尴尬的是GA的开发文档竟然写的乱七八糟的(https://developers.google.com/analytics/devguides/collection/analyticsjs/cross-domain)。而且还有错误。 经个人测试后最终正确的代码段如下: 【本篇文章来自道哥博客http://www.seodug.com/,您看到的可能只是采集的结果,原主题会不断更新以提供高质量的内容,如果您想看到更多100%原创,高质量,一线实战SEO的分享和… 阅读全文
ontheway

2014新起点

1,在别人恐慌时贪婪,在别人贪婪时恐慌。 2,人无我有,人有我精。 3,哪里有用户那里就该有营销。 4,不要把过程当成目的,更不能为了过程而过程。 5,既然想,就要干,这是一个行动大于思考的时代,执行力大于一切。 阅读全文
11

分享个GA小技巧——获取referral的完整URL

用GA的都知道referral是只显示URI而不显示query string的。在绝大部分情况下,这很不方便,尤其是经常在referral中发现来自于百度,搜搜等莫名其妙未被统计入organic流量的情况。只能说真TMD的EGG PAIN。 解决方法就是利用filter直接将referral地址写入user defined value,然后再需要的报告中选择secondary dimension的user defined value即可。 由于很简单,所以我就只截个图了。 阅读全文
new-old

GA新版功能的不完全解读

最近GA做了两次大规模改版,修改了GA使用率最高的traffic source、content面板以及最核心的advanced segment功能。此举对习惯了使用老版界面的用户又产生了一定的冲击(拥抱变化吧= =),一开始我也是各种蛋疼不习惯,但是在用了段时间后的确感受到了GA团队的用心良苦,下面我就为大家解读下此次GA改版带来的一些新变化以及目的: 首先来谈一下traffic source以及content面板 这两个面板在改版后整个更名,新名称为Acquisition以及Behavior,个人偏好的中文翻译为“流量获取”以及“用户行为”。

最近GA做了两次大规模改版,修改了GA使用率最高的tr… 阅读全文
GA题目

GA报表熟悉度测验题(答案已更新)

昨天有一个任务,是要从GA中抽取四个省各城市2012年及2013年1-10月的UV及PV数据生成类似下面的报表 结果我愣是脑子进水的ctrl+c,ctrl+v做了将近一个小时,晚上睡觉的时候怎么想怎么不对劲,然后突然灵光乍现,早上过来5分钟就搞定了这活。。。但是把报表结构小改了下,改成这种 阅读全文
01200000000481118454359178616

浏览器原生支持的unicode编码类型

我测试下来分别有以下几种unicode编码浏览器是能够自动识别并转换成对应中文的: 1,html实体及html实体编号 html实体大家肯定都知道,最常见的就是 代表空格。但很多人没留意的是html实体编号其实浏览器也是可以自动识别的,特征是:&#{10进制数字};或者是&#x{16进制数字};。其实html实体说白了就是使用10进制或16进制的unicode进行加密的而已,浏览器 阅读全文
123123

大中型网站全自动收录抽查系统思路概述

夜息的“SEO的数据分析II – 如何改善网站收录”一文中详细介绍了如何从分析网站收录到改善收录率来提升SEO流量,这个任务需要我们建立一个体系来监控不同类型页面甚至是不同频道的收录率以便于长期掌控SEO流量的走势。但是大中型网站少则以万计的URL数量导致了收录的监控本身成了个很繁琐的事情,那么较效率又不失精度的解决办法就是随机抽样来查收录率(可参考天极网废小米的百度收录抽查一文),但是如果没有技术上的配合,手动做这个事情的话依旧费时费力而且不讨巧,比如用excel来做随机抽样,一来效率低下,二来单条URL的抽中概率无法保证。因此,建立一个全自动收录抽查系统势在必行。 这篇文章主要是谈一… 阅读全文