网站分析如何进行(中)
Posted on 十一月 16, 2009
Filed Under 分析实践 | 4 Comments
原创文章,转载请注明: 转载自网站分析 Web Analytics
本文链接地址: 网站分析如何进行(中)
现在越来越多网站的市场人员逐渐认识网站分析(Web Analytics),也逐渐了解网站分析对网站运营的重要作用。其中很多的网站也开始尝试使用网站分析工具来监测网站的流量,分析用户的行为。也有一些,可能也意识到网站分析很重要,但是却不知道如何入手。因此,我想把我的一些体会写下来,以供参考。
第三步:网站分析工具的选择
现在市面上有许多的网站分析工具,该如何选择确实是非常重要同时要谨慎斟酌的事情。
从技术实现上来讲,网站分析工具主要分为日志型和标签型两类。日志型网站分析工具是通过读取和分析网站服务器产生的访问日志,形成报表的,这类工具以Webtrends、Urchin、Awstats为代表。标签型网站分析工具是通过在页面中部署代码的方式,将搜集到的数据发送到数据采集服务器,并最终通过服务器的处理形成报表,这类工具包括Omniture、Google Analytics、Statcounter等。标签型网站分析工具的工作原理可以参看《脚本型网站分析工具工作原理》。这两类工具应该如何取舍呢?可以从以下几个方面来考虑:
业务需求
日志型网站分析工具的数据源是网站服务器的访问日志,访问日志一般包含访问者IP地址、访问时间、访问文件的URL、访问文件的大小、访问来源以及客户端的一些信息。注意到了吗?除了URL以外,没有和网站业务相关的信息了,同时其原理也限制了这类工具的定制方面的功能。
标签型网站分析工具通过部署在页面上的代码来收集数据,除了文件的大小以外,上面提到的信息都可以得到。除此之外,有些工具还提供了使用自定义的变量来跟踪一些与业务相关的数据。比如说,访问者是否登录、访问者在站内搜索中使用哪些关键词等。这些数据能够更贴近业务,能解决更多的业务问题。
准确性
唯一访问者(Unique Visitor)这个参数很重要,访问者多次访问的行为就是依靠唯一访问者关联起来的。日志型网站分析工具根据IP地址来判断唯一访问者,相同IP地址的访问,被判断为来自同一个访问者。标签型网站分析工具是根据Cookie来判断的,Cookie中保存访问者的唯一标识,每份Cookie中保存的标识都是不同的,然后在数据中心的数据库中这些唯一标识会将访问者的所有行为串联。
一般来说,使用Cookie来判断会比使用IP来判断准确性更高。因为一般用户的IP都是动态的IP,会经常发生变动,这会严重影响日志型分析工具的数据整合。而Cookie的接受率通常在95%以上甚至更高,这会带来更高的精度。
部署和维护
不论选择何种分析工具,都会有部署的过程。
日志型的工具一般数据分析是在本地进行的,需要将访问的日志导入到工具中,工具会运行分析程序,最终到处报表。前期最好采购单独的服务器来保存日志和安装分析程序,这不会有什么问题。但对一些大流量,后期的维护是比较头疼的事情。因为日志需要导入后才能分析,的网站来说日志的保存是很麻烦的事情。同时因为数据量比较大,从导入日志到最后跑出报表经常需要很长的时间,我就听过客户抱怨说几天以后才能看到当前的报表。
标签型的工具不需要采购服务器,数据保存在服务提供商那里,只要把代码安装网页中就可以看到报表。相对来说实施起来简单。同时,后期不需要保存日志,很多标签型网站分析工具提供的也是实时的报表。
保密性
一般的日志型分析工具是部署在本地的,而绝大部分的标签型网站分析工具都是采用SaaS模型提供服务,也就是说,数据是发送到产品供应商的服务器上的。网站分析供应商都会有严格的保密协议和流程,对于一般的网站不用太担心。不过对于一些需要严格保密的网站来说,象银行、证券、电信等行业,数据的绝对安全是不得不考虑的。这种情况下建议使用日志型的分析工具,确保数据的安全。
如果不是某些需要特别保密的行业,我个人的推荐还是使用标签型的网站分析工具。那这部分工具也有不少,应该如何取舍呢?以下是我对这些工具的个人评价,仅供参考。
Omniture和Coremetrics:提供定制的跟踪内容,全面的报表,强大的配套与整合功能。几乎网站分析的所有需求都能提供相应的解决方案。不过,收费,而且不便宜。
Google Analytics:相对前面的二位,只是在自定义、路径分析和整合方面有所不足,报表要在第二天才能看到,但作为满足一般分析的需要,它完全可以胜任,而且更重要的是它是完全免费的,很难想象这样强大的一款工具竟然可以免费使用。
Woopra:一款新推出不久却很有个性的网站分析工具。它需要安装客户端,而不是象大多数通过浏览器来阅读报表,报表的展示更精美。另外还能实时和访问者聊天,同时在页面停留时间的计算上也有独到之处。
CrazyEgg:CrazyEgg并不能帮您解决网站分析的所有问题,不过如果您对网站的点击热图特别关心的话,CrazyEgg是一个不错的选择。它通过很炫的可视图形展示访问页面的访客们的信息和行为,而价格也比较便宜。
BTBuckets:专注于测试和目标人群区分的工具,类似于Omniture的Test&Target。目前是免费使用的。
这里仅仅列举了一些比较有特点的工具,其实还有不少工具,不过我感觉免费的Google Analytics的光芒足以掩盖它们。
如果是在标签型的网站分析工具中选择,一定需要考虑好,因为一旦发现不能满足的需求,是没有后悔药吃的,即使更换别的工具,更换之前的数据将没办法再得到,对于瞬息万变的互联网世界来说,网站可能失去很多机会。还记得上一篇中提到,我们需要整理出关心的业务问题吗?如果这些问题使用Google Analytics都能搞定,免费的Google Analytics肯定是必然的选择。如果有些Google Analytics无能为力,可能就需要考虑收费的工具,考虑到工具本身更为强大以及有同时提供的支持与服务,相信也是物有所值。
第四步:网站分析工具的部署
在选择和购买网站分析工具以后,需要将工具部署到网站上。受个人经验的限制,以下主要讨论标签型网站分析工具的部署。一些收费工具提供了相应的服务,会帮助网站的运营者将工具部署到网站中,并做相应的验证。如果选择了免费的工具,则需要依靠网站自己完成相应的工作。
首先,需要对网站分析工具进行配置和定制。比如,Google Analytics提供了一个Goal页面、用户自定义报表、Filter等自定义功能,活用这些功能能够帮助网站更好更准确的跟踪网站访客的行为。然后,将工具提供的一段代码,部署到页面上。最后,需要对整个部署进行检查。部署是否正确对得到的报表中数据影响非常大,所以检查的部分非常重要。可以通过下面一些角度来检查:
- 代码是否部署在HTML的body中。
- 页面上有没有JavaScript错误。
- 报表中的PV数与估计的或其他工具检测到的有没有明显差距。
- 跟踪到的注册、成交等数据与网站本身数据库中的数据是否对得上。
- 检查报表中有没有不符合逻辑的情况。
验证页面上部署的代码,推荐使用一个叫WASP的Firefox的插件,这个插件可以检查Firefox当前打开的页面上部署的主流的网站分析工具,以及这些工具采集到的数据。
以上只是我个人的意见,欢迎留言表达你的看法!
您也许还对以下内容有兴趣:
评论
4 Responses to “网站分析如何进行(中)”
Leave a Reply

二月 5th, 2010
赞,那么好的网站才发现
[回复]
四月 11th, 2010
本人由于用WebTrends用得相对多一些,在这里谈几点看法供参考。
(1). 对网站分析工具作日志型和标签型的分类,只能是一种叙述上的方便,不能作功能上的绝对区隔。
(2). 文中提到的WebTrends, 既是日志型的,也是标签型的。采用WebTrends Smart Data Collector(简称SDC), 在网页上嵌入js代码,就可以收集所需要的访问数据。收集的数据既可以保存在WebTrends公司的服务器上,也可以保存在用户指定的任何一台机器上。WebTrends公司既提供产品, 也提供分析服务。
在这一点上,WebTrends比绝大多数网站分析工具来得灵活。
(3). 标签型工具收集到的数据最后还是要以某种格式的日志文件形式存放起来才能分析,当然大多数是存放在产品提供商那里,用户不能直接接触到而已。
(4). UV的准确性高低问题,作者在文中说“日志型网站分析工具根据IP地址,标签型网站分析工具是根据Cookie来判断的”,这个论断不全面,或者讲不确切。不管日志型、标签型,都可以灵活运用IP地址、Cookie、代理(agent)、URL参数、认证用户等由用户根据实际情况灵活设定,这视具体分析工具而定,象WebTrends就是这么做的。
(5). 网站分析工具由于使用的性质,报表的提供总会有一定的时间滞后性。要想得到绝对的实时性,既做不到(特别对大流量的网站来
说),由于存在点击流记录的时序颠倒问题,也会使得分析结果的准确性存在问题。
(6). 网站的访问数据,是一个企事业单位独特的信息资源,应该很好地加以保密,防止泄露,这对银行、证券、电信等企业自不待言。对电子商务的企业而言,由于网站日志中保含了全部网上交易的信息,也应十分戒备,虽说网站分析供应商都会有严格的保密协议和措施,但毕竟部分家底交给了别人保管,总归不能令人放心的,万一供应商保密措施有漏洞,日志数据或分析结果被竞争对手知晓,后果严重。
(7). 标签型工具这种在网页上嵌js代码的方法, 也是有一定缺陷的。针对电子商务网站而言,这种方法收集不到支付银行在后台的对帐记录,另外也收集不到恶意访客(如抓取产品信息的自动程序)的访问记录,也就无从分析银行对帐情况,无从分析恶意访客的活动情况(以便采取某种措施如用防火墙对恶拦截)。
[回复]
四月 11th, 2010
对不起,刚才最后一段圆扩弧中的文字需要补充,完整表达如下:
(7). 标签型工具这种在网页上嵌js代码的方法, 也是有一定缺陷的。针对电子商务网站而言,这种方法收集不到支付银行在后台的对帐记录,另外也收集不到恶意访客(如抓取产品信息的自动程序)的访问记录,也就无从分析银行对帐情况,无从分析恶意访客的活动情况(以便采取某种措施如用防火墙对恶意访客进行拦截)。
[回复]
四月 12th, 2010
哇!本博客到目前为止最长的一篇回复。激动中。
关于留言中涉及到的内容,我专门开一篇文章和您讨论。
[回复]