脚本型网站分析工具工作原理

Posted on 十月 17, 2009
Filed Under 分析工具 | 1 Comment

原创文章,转载请注明: 转载自网站分析 Web Analytics
本文链接地址: 脚本型网站分析工具工作原理

脚本型网站分析软件,通过插入到页面上的一段JS代码,来抓取用户的访问记录和相关信息。下面以本网站的Google Analytics为例,介绍一下网站分析软件是如何工作的。

首先,需要从Google Analytics得到一段JS代码,然后将这段代码插入到网站每个页面的</body>标记之前。注意,一定要放在<body>和</body>之间的区域内,否则Google Analytics不能捕获任何数据。

GA code

正确插入这段代码以后,当用户访问这个网页,那么这段代码就会在用户的浏览器上执行。它会收集当前网页、用户客户端等信息。然后,将这些作为参数,拼接在一个图片请求的后面。这个图片请求是通过HTTP协议发送到Google Analytics的数据收集服务器的。作为这个图片请求的响应,数据收集服务器会返回一个1×1像素的图片在页面上显示。下图是在浏览www.webanalytics.org.cn首页时发送到数据收集服务器的请求。

网络数据包

从图中可以看到,有一个数据包发送到Google Analytics的数据收集服务器,通过HTTP协议请求了一个图片,并在图片链接后面加上了一长串的参数。将参数分割出来,有以下一些:
utmwv=4.3
utmn=1196537578
utmhn=www.weblytics.cn
utmcs=UTF-8
utmsr=1024×768
utmsc=32-bit
utmul=en-us
utmje=1
utmfl=10.0 r22
utmdt=网站分析工具 | 网站分析
utmhid=1766743862
utmr=0
utmp=/?tag=网站分析工具
utmac=UA-8982891-1
utmcc=__utma=69577110.67499046715024370.1243733087.1243748047.
1243751471.6;+__utmz=69577110.1243740545.3.4.utmcsr=newsunday.
com|utmccn=(referral)|utmcmd=referral|utmcct=/post/863.html; HTTP/1.1

这些参数传递了网站的域名、网页的位置,客户端的浏览器版本、语言、屏幕分辨率颜色深度,访问来源等信息。数据收集服务器接受到这些信息的同时,根据发送来源的IP地址,可以确定用户所在的区域。

当用户访问了网站上的多个页面,就会发送多次这样的数据。Google Analytics就会了解到用户首先访问了A页面,然后访问了B页面,再访问了C页面,最后离开。Google Analytics会将这些访问记录串联起来,形成访问的路径。从而,Google Analytics会得出Entries、Exits、Bounce Rate、Next Pages这些量度来。网站的管理者就可以通过访问Google Analytics的报表界面了解到这些数据。

您也许还对以下内容有兴趣:

评论

One Response to “脚本型网站分析工具工作原理”

  1. UEDBase | 用户为先·专注体验 » Blog Archive » 网站分析的步骤发表:
    六月 17th, 2010

    [...] 2、分析软件的部署实施 网站分析,不是主观的臆断,而是建立在数据基础上的。端一杯茶,对这显示器,想出来的分析报告,很可能是谬误的。我们总设身处地的从用户角度考虑,但其实用户想的很可能与我们不同,我们离网站太近了。而分析软件没有感情、没有偏见、不会说谎,可以让我们更接近事实。现在免费的软件有Google Analytics,需要费用的最好的是Omniture的SiteCatalyst。通过这些软件,可以采集到用户对网站访问的各种数据,分析软件如何工作可以参考《脚本型网站分析软件工作原理》。在实施之前,需要按照确定的目标设定部署的战略。部署了分析软件以后,就可以得到包含各种数据的报表。对分析人员来说,只要是技术方面的要求,在部署和报表以及他们之间的关联很熟悉。 [...]

Leave a Reply