网站分析数据的准确性

accuracy前几天,有人问我:“有一些用户的浏览器禁止了Cookie,对这部分用户判断唯一访客(Unique Visitor)的时候岂不是不准确了?”事实确实如此,如果浏览器不能接受Cookie,网站分析软件就不能准确判断多次访问是否来自同一个浏览器,确实最后得到的数据是不准确的。其实,就算所有的浏览器都允许Cookie,就能得到准确数据吗?其实也不行。我们得到的是唯一浏览器(Unique Browser),并不是真正的访客。同一个访客可以在家里的电脑、办公室电脑、酒店的电脑浏览我们的网站。这时会得到三个唯一访客,而其实他们都是同一个人。

其实,还有很多通过网站分析工具抓取到的数据都是不准确的。比如说:网页停留时间

先让我们看看网站分析工具是如何跟踪访客在页面上停留的时间的。举个例子:一个访客在8:00打开了网站的首页,网站分析工具就会抓到这个数据;接着,他又在8:02分打开了“新闻”分类的页面,网站分析工具同样会抓到这条数据;接下来,8:05分,他有点开了“NBA新闻”分类的页面;最后,他在“NBA新闻”页面中发现姚明该死的伤还没有好,索性就关掉了浏览器。网站分析工具会统计两次连续页面打开动作之间间隔的时间,这个间隔的时间就算作访客在这个页面上停留的时间。在上面的例子中,访问者在首页呆了2分钟,在“新闻”分类页呆了3分钟。这样计算在上面这种情况下没有问题。(参考《基本量度讨论》)

页面重定向及其对分析数据的影响

重定向页面是一种特殊页面,当访客访问一个重定向页面时,该页面会立即自动跳转到目标页面,也许用户可能都没有感觉到中间还经过了一个页面,就已经跳转了。
404-301重定向

那么为什么会有重定向页面在网站中存在呢?常见的网页自动跳转有下列一些应用:

广告点击的跟踪

很多门户类网站会出售广告位给客户,客户可以购买这些广告位展示自己的内容,建立指向自己网站的链接从而导入更多的流量。这些门户网站就需要统计出这些链接被点击的情况,提交给用户。

在很多网站中,有针对网站内部某些产品或者内容的推广。这些网站会为某些产品或者内容在首页显眼位置放置广告,从而有目的的带去更多的流量。网站的运营者当然也希望了解广告点击的情况。

第一方Cookie VS 第三方Cookie - Cookie详解

什么是Cookie,它有什么用处?

Cookie是网站存放在客户端的一小段数据。一般的,网站为了提升用户体验,在客户的客户端中保存用户的历史信息,以备用户再次访问时网站能提供更方便,更有针对性的服务。比如,网站可以记住你的登录状态,只要登录一次下次访问就不用在登录;购物网能记住你浏览过的产品,保留你购物车中的物品。这些都有Cookie的功劳。

Cookie对网站分析又有什么作用?

网站分析是以数据为基础的,而数据的采集需要借助网站分析工具。主流的网站分析工具主要分两种类型:日志型和页面脚本型。这两种类型工具的一个区别就在于对Unique Visitor的区分很判断。当网站有很多次访问的记录的时候,如何判断那些访问来至同一个用户。日志型的分析工具,一般通过访问的来源IP地址进行判断,通过相同IP地址的访问被认为来至同一个用户。页面脚本型的分析工具,就需要根据Cookie的记录来判断不同的访问是否来至不同的用户。这类的工具会在Cookie中存放用来标识唯一用户的ID,每个浏览器得到的ID都是不同的。用户访问时检查Cookie中的ID,ID相同的访问被认为来至同一个用户,否则,则是不同用户的访问。

脚本型网站分析工具工作原理

脚本型网站分析软件,通过插入到页面上的一段JS代码,来抓取用户的访问记录和相关信息。下面以本网站的Google Analytics为例,介绍一下网站分析软件是如何工作的。

首先,需要从Google Analytics得到一段JS代码,然后将这段代码插入到网站每个页面的</body>标记之前。注意,一定要放在<body>和</body>之间的区域内,否则Google Analytics不能捕获任何数据。

GA code