首页 > 运营 > 建站经验 > 正文

统计系统的五维理论

2020-10-03 17:16:35
字体:
来源:转载
供稿:网友

最近一直在思考统计系统的统计规则怎样实现。昨天终于有了一点灵感,可以用数学模型来描述统计系统。(这里所说的统计系统是指网站统计系统web analytics)

统计系统统计的是访问者在对网站的访问情况,或者说是访问者的访问行为。这里面包含三个基本要素:
1.访问者
访问者对应ip,但有共享上网的情况,所以更准确点,需要对应cookie。
2.网站
说是网站,其实更准确的说应该是url,传统的网站都是一个url对应一个叶面,统计系统的统计也都是基于url的。但随着动态技术、ajax、flash等在服务端存储状态以及异步应用的出现,很多url指代的内容也不再固定(这个暂不考虑)。
url又包括两种,来源url(referrer)和目标url(当前网页)
3.时间
这个不用说了,一切以时间为基础。

上面三个就形成了用户访问网站的最基本三维,目前大多数统计系统还是基于这三维的,而且大部分是不是完整的建立在这个三维坐标系内,很多只是分别实现了2和3的二维,1和3的二维;1和2的联系没有完整建立起来。比如51.la、google analytics等。

完整建立起三维空间的统计系统很少,目前我知道的只有getclicky.com,还有我自己的统计系统(www.referer.cn):P
getclicky的三维并不完整,我简单看了一下它的演示,时间轴是有区间的,只在一天(day)的范围上有效,跨日的统计没有建立。
referer比较完整,但目前实现的统计规则比较少。

上面说了三维,另外的两维从何而来呢?

三维的统计系统只是实现了用户访问的统计,并没有实现用户在网站上行为的统计。什么是用户行为呢?也就是用户在网页上干什么,是在读还是在写?用户要在网页上产生行为,必须通过电脑,通过鼠标键盘,所以对用户行为的统计转化为对鼠标键盘操作的统计。通过简单的触发,我们可以统计到用户在页面的什么位置点了鼠标,用户通过键盘输入了什么内容。

对键盘行为的捕获意义不是很大,但实现难度和成本却很高,所以暂且放弃对键盘事件的统计。

剩下的就是对鼠标行为的统计了,鼠标的运作原理就是在屏幕的二位坐标系内确定坐标。我们要做的就是捕获鼠标的坐标以及点击行为。通过对鼠标行为的捕捉和深入分析,可以获得很多有价值的数据。

因而产生了统计系统另外的两个纬度:屏幕的坐标。

目前能够实现鼠标行为统计的还很少,我知道的有http://www.tapefailure.com、http://www.clicktale.com/、www.crazyegg.com、http://www.mybloglog.com/
然后就是我的referer了.
这种行为统计系统数据量要大很多,大部分系统只是实现了部分的统计,比如只统计点击时的坐标,clicktale和tapefailure完整统计了鼠标移动轨迹,估计是由于数据量的原因,clicktale到现在只是小范围测试,没有进展。tapefailure似乎是模仿着clicktale来的,回放界面都差不多。

referer是目前是实现点击统计,但只是开放了链接上点击的统计,效果可以在我的blog上看到,点击过的链接上会有一个浮动的统计标签。

随着互联网应用的发展,仅仅做到这五维的统计是不够的,就像前面提到,flash和ajax应用,已经使内容和url不再一一对应。这就使得统计精确度和难度更大,如果要做到这方面的统计,那就不是三维或者五维能够完成的了。

其实这是一种垂直趋势,任何行业都如此,不断的深入,不断的完善。统计系统将朝着这个方向发展,并且是飞快的发展。

Author:David | English Version 【转载时请务必以超链接形式标明文章原始出处和作者信息及本声明】
URL:http://blog.iyi.cn/start/2007/05/post_163.html

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表