原始日志文件分析
首页 --> seo技术/seo技巧

原始日志文件分析

成功案例分类
自助网站型    更多案例

一点通案例

手工网站型

联系我们

电话:010-64681504 010-64684094

传真:010-64673024

邮箱:888@edo2008.com

24小时值班热线

手 机: 013693193565


原始日志文件分析

网络营销人员重要的工作之一就是分析用户行为。买了产品,为什么买;没买,又是什么原因。分析网站流量是分析用户行为的最基本方式。

一部分网站流量统计分析软件是以服务器日志文件为基础的。

网站服务器会把每一个访客来访时的一些信息自动记录下来,存在服务器原始日志文件中。

一般主机提供商会在控制面板提供这个日志文件给你下载。如果你的主机提供商不提供原始日志文件 的话,你就该换地方了。

原始日志文件就是一个纯文字形式的文件,只要用文字编辑软件如WordPad或Notepad打开就可以了。

我们来看一下日志文件提供了哪些信息:

一、用户IP地址
221.201.77.63 这是访问者所使用的IP地址,能够告诉你来访的人来自什么地理位置。如果通过IP地址信息查询服务一下这个IP地址所属位置,可以看到这位访客来自大连。

查询方法:http://ip.china.com/?ip=221.201.77.63

二、日期/时间
01/Jul/2006:15:30:41  这是某一个文件被访问的时间。和IP地址结合起来,就可以跟踪某一个特定的用户从一个网页到另一个网站的访问顺序。

三、时区
+0800 这个数字是相对格林威治时间的时区差多少。

四、服务器动作
GET /seobolg/1006/04/17/user-friendly-website/HTTP/1.1

服务器要做的动作要么是GET,要么是POST。除了一些CGI脚本外,通常都应该是GET,即从服务器上获取某个网页或图片文件。

这行意思就是,按HTTP/1.1协议 获取文件/seobol/2006/04/17/user-friendly-website/ 

五、返回状态码
200 这一行是服务器返回的状态。200就是说成功获取了文件,一切正常。如果是返回了404,就是文件没有找到。其他常见状态码包括以下几种。

(1)301 :永久转向
(2)302 :暂时转向
(3)304 :文件未改变,客户端缓冲版本还可以继续使用
(4)400 :非法请求
(5)401 :访问被拒绝,需要用户名、密码
(6)403 :禁止访问
(7)500 :服务器内部错误,通常是程序有问题
(8)503 :服务器没有应答,如负载过大等

六、文件大小
19031 这一行指的是所获取文件的大小(字节)。

七、访客来路
http://www.baidu.com/s?wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&C1=3
这一段是显示浏览是从哪里来到这个网页,也就是来到这个网页之前访问的那个网页。有可能是同一个网站的其他页,有可能是其他网站,也有可能是来自搜索引擎的搜索页。

如果是来自搜索引擎的搜索页,其中还含有另一个重要信息,也就是用户搜索的关键词。

八、浏览器类型
Mozilla/4.0(compatible;MSIE 6.0;WindowsNT 5.1;SV1;Alexa Toolbar)
这一段所显示的是浏览器和用户计算机的一些信息。

比如上面这一段就表示用户所使用的计算机是与Netscape兼容的Mozilla浏览器,windowsNT操作系统,浏览是IE6.0,装有Alexa Toolbar。

九、跟踪用户轨迹
这是很多网站运行者需要研究的地方。

从日志文件中剔除对图片的访问,剔除中间插进来的其他浏览者的信息,只把来自某一个特定IP地址的用户在一段时间内所看到的网页列出来,就能看到这个用户在人人乐 的网站上都有哪些行动,看了哪些网页。