经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » Linux/Shell » 查看文章
通过日志过滤的方法,统计每天内容详情页面的PV数
来源:cnblogs  作者:LWQTX  时间:2018/9/28 16:52:58  对本文有异议

1、目的:

每天凌晨0点1分统计用户点击进入内容详情页的次数,对内容点击量形成榜单。

 

2、分析:

A、/data/log/epg.access.log日志实时打印用户访问页面的日志,并且每天凌晨0点会进行日志切割,将前一天的日志保存为epg.access.log_YYYYMMDD。

B、分析日志发现:用户进入详情页时,/data/log/epg.access.log日志会打印含series_detail.jsp的信息,且内容ID打印在该串信息中的第71位至102位。

C、根据内容ID的点击量从大到小统计排序,输出一个文本文件。

 

3、脚本实现

  1. 1 #!/bin/bash
  2. 2
  3. 3 log_path="/data/log/"
  4. 4 src_ser="epg.access.log"
  5. 5 output_ser="PV"
  6. 6 date_str=`date +%Y%m%d -d '-1 days'`
  7. 7 dst_file=${src_ser}_${date_str}
  8. 8 outputfile=${output_ser}_${date_str}
  9. 9 cd $log_path
  10. 10 awk '{print $11}' $dst_file |grep 'series_detail.jsp' |cut -c71-102 |sort|uniq -c|sort -nr >> $outputfile

 

4、截图

原日志截图:

 

输出文件截图(第一列为点击量,第二列为内容ID):

 

 

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号