利用shell命令统计日志的方法详解-巨人网络通讯

主页 > 知识库 > 利用shell命令统计日志的方法详解

利用shell命令统计日志的方法详解

前言

大家都知道，通过使用 shell 命令可以很方便地对日志进行统计和分析，当服务有异常的时候，需要去排查日志，那么掌握一种统计日志的技巧就是必不可少的了。

假设有一个包含下面内容的日志文件 access.log。我们以统计这个文件的日志为例。

date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=something | status=200 | time=9.703 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 00:00:00 | ip=100.109.222.3 | method=HEAD | url=/api/foo/healthcheck | status=200 | time=0.337 | bytes=10 | referrer="-" | user-agent="-" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=anything | status=200 | time=8.829 | bytes=466 | referrer="-" | user-agent="GuzzleHttp/6.2.0 curl/7.19.7 PHP/7.0.15" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=everything | status=200 | time=9.962 | bytes=129 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"
date=2017-09-23 13:32:50 | ip=40.80.31.153 | method=GET | url=/api/foo/bar?params=nothing | status=200 | time=11.822 | bytes=121 | referrer="-" | user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.63 Safari/535.7" | cookie="-"

不同的服务对应的日志可能不一样，本文使用示例日志的格式是：

date | ip | method | url | status | time | bytes | referrer | user-agent | cookie

注意：mac 系统和 linux 系统中的命令行为可能不同，以下命令请在 linux 系统中使用

排除特殊日志

统计日志时，我们可能不关心 HEAD 请求，或者只关心 GET 请求，这里首先需要筛选日志，可以使用 grep 命令。-v 的含义是排除匹配的文本行。

grep GET access.log # 只统计 GET 请求
grep -v HEAD access.log # 不统计 HEAD 请求
grep -v 'HEAD\|POST' access.log # 不统计 HEAD 和 POST 请求

查看接口耗时情况

我们可以将每行的 time 匹配出来，然后做一个排序。使用 awk 的 match 方法可以匹配正则：

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log

awk 命令使用方法如下：

awk '{pattern + action}' {filenames}

我们实际上只用到了 action：match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1] 这一段。

match 方法接收三个参数：需要匹配的文本、正则表达式、结果数组。$0 代表 awk 命令处理的每一行，结果数组是可选的，因为我们要拿到匹配结果所以这里传入了一个 result 数组，用来存储匹配后的结果。

注意这里的正则我没有使用 \d 来表示数字，因为 awk 指令默认使用 “EREs"，不支持 \d 的表示，具体请看 linux shell 正则表达式(BREs,EREs,PREs)差异比较。

result 数组实际上和 javascript 里的结果数组很像了，所以我们打印出第二个元素，即匹配到的内容。执行完这行命令后结果如下：

当然实际上一天的日志可能是成千上万条，我们需要对日志进行排序，且只展示前 3 条。这里使用到 sort 命令。

sort 命令默认从小到大排序，且当作字符串排序。所以默认情况下使用 sort 命令之后 "11" 会排在 "8" 前面。那么需要使用 -n 指定按数字排序，-r 来按从大到小排序，然后我们查看前 3 条：

awk '{ match($0, /time=([0-9]+\.[0-9]+)/, result); print result[1]}' access.log | sort -rn | head -3

结果：

11.822
9.962
9.703

查看耗时最高的接口

当然我们一般不会只查看接口耗时情况，还需要把具体日志也打印出来，上面的命令就不能满足要求了。

awk 的打印默认是按空格分隔的，意思是 2017-09-23 GET 这一行如果使用 awk '{print $1}' 会打印出 "2017-09-23"，类似地，$2 会打印出 GET。

根据日志特征，我们可以使用 | 来作为分隔符，这样就能打印出各个我们感兴趣的值了。因为我们想找出耗时最高的接口，那么我们把 time、date 和 url 单独找出来。

awk 的 -F 参数用来自定义分隔符。然后我们可以数一下三个部分按 | 分隔后分别是第几个：time 是第 6 个、date 是第 1 个、url 是第 4 个。

awk -F '|' '{print $6 $1 $4}' access.log

这样打出来结果为：

 time=9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
 time=0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
 time=8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
 time=9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
 time=11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

因为我们想按 time 来排序，而 sort 可以按列来排序，而列是按空格分隔的，我们目前第一列是 time=xxx，是不能排序的，所以这里要想办法把 time= 给去掉，因为我们很鸡贼地把耗时放在了第一列，那么其实再通过 time= 进行分隔一下就行了。

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}'

结果：

9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something
0.337 date=2017-09-23 00:00:00 url=/api/foo/healthcheck
8.829 date=2017-09-23 13:32:50 url=/api/foo/bar?params=anything
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing

使用 sort 的 -k 参数可以指定要排序的列，这里是第 1 列；再结合上面的排序，就能把耗时最高的日志打印出来了：

awk -F '|' '{print $6 $1 $4}' access.log | awk -F 'time=' '{print $2}' | sort -k1nr | head -3

结果：

11.822 date=2017-09-23 13:32:50 url=/api/foo/bar?params=nothing
9.962 date=2017-09-23 13:32:50 url=/api/foo/bar?params=everything
9.703 date=2017-09-23 13:32:50 url=/api/foo/bar?params=something

统计请求次数最多的接口

如果需要统计哪些接口每天请求量是最多的，只需要新引入 uniq 命令。

我们已经可以通过 grep -v HEAD access.log | awk -F '|' '{print $4}' 来筛选出所有的 url，uniq 命令可以删除相邻的相同的行，而 -c 可以输出每行出现的次数。

所以我们先把 url 排序以让相同的 url 放在一起，然后使用 uniq -c 来统计出现的次数：

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c

因为示例日志数量太少，我们假设日志里有多条，那么结果应该类似下面：

1 url=/api/foo/bar?params=anything
19 url=/api/foo/bar?params=everything
4 url=/api/foo/bar?params=nothing
5 url=/api/foo/bar?params=something

接下来再 sort 即可：

grep -v HEAD access.log | awk -F '|' '{print $4}' | sort | uniq -c | sort -k1nr | head -10

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

shell脚本实现的网站日志分析统计（可以统计9种数据）
使用shell脚本分析网站日志统计PV、404、500等数据

标签：赣州乌兰察布昌都抚州临沂海北广东连云港

巨人网络通讯声明：本文标题《利用shell命令统计日志的方法详解》，本文关键词利用,shell,命令,统计,日志,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《利用shell命令统计日志的方法详解》相关的同类信息！

利用shell命令统计日志的方法详解

前言大家都知道，通过使用 shell 命令可以很方便地对日志进行统计和分析，当服务有异常的时候，需要去排查日志，那么掌握一种统计日志的技巧就是必不可少的了。假设有一个包含...

10-18

附近客电销机器人哪里买（电销机器人线路商）

本篇文章给大家谈谈附近客电销机器人哪里买，以及电销机器人线路商对应的知识点，希望对各位有所帮助，不要忘了收藏本...

05-16

电销办信用卡效果怎么样（电话营销办信用卡能相信吗?）

今天给各位分享电销办信用卡效果怎么样的知识，其中也会对电话营销办信用卡能相信吗?进行解释，如果能碰巧解决你现在...

08-28

抖音代运营在宁德市一个月大概多少钱

自从抖音推出电商功用之后，越来越多商家是入驻到抖音开店。对于新账号来说，养号是少不了的一个过程;但不少抖音商家...

03-01

长沙呼叫电销系统代理（电销呼叫中心系统）

本篇文章给大家谈谈长沙呼叫电销系统代理，以及电销呼叫中心系统对应的知识点，希望对各位有所帮助，不要忘了收藏本站...

08-28

荆州外呼企业管理系统（荆州市外国语学校）

今日给各位共享荆州外呼企业办理体系的常识，其间也会对荆州市外国语校园进行解说，假如能可巧处理你现在面对的问题，...

05-18

品牌商标扩张的概念

关于商标扩张（Brandstretching）的概念，学术界有不同的定义标准。我们综合比较国内外各家之言，选择了较为广义的商标扩张...

10-23

linux硬盘检测健康状态

定期检查硬盘的健康状态是每个系统管理员必须要做的事情。说到硬盘的健康状态，这里就得先说一下S.M.A.R.T.了。 SMART是一...

10-20

江西人工智能外呼管理系统（江西人工智能外呼管理系统官网）

今日给各位共享江西人工智能外呼办理体系的常识，其间也会对江西人工智能外呼办理体系官网进行解说，假如能可巧处理你...

11-07

石家庄实惠的电销卡套餐（石家庄实惠的电销卡套餐有哪些）

本文目录一览：1、电销卡在哪里办理多少钱2、做电话营销,用什么电话卡最便宜啊,请大家支个招!急,急,急!3、电话销售用什么...

07-10

湖州电信电销系统办理价格,群呼线路-请看!

湖州电信电销系统办理价格,群呼线路营销方式：电销机器人不仅拥有高效客户的资料整理，外呼系统提高意向客户转化率，...

12-17

包含长春语音外呼系统公司的词条

本篇文章给大家谈谈长春语音外呼系统公司，以及对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。本文目录一...

05-16

直播武汉百度地图标注实时路况助力市民安全出行

1473 7月6日凌晨武汉再次遭遇了100毫米以上的强暴雨，百度地图标注针对武汉暴雨紧急上线实时直播，提醒市民注意积水地段...

04-14

白名单电销卡不封号-电销卡哪里买

科技有限公司主营电销卡、不封号电话卡、不封卡电话卡、防封外呼系统、电销专用卡、电销软件、高频防封电销座机，国代...

02-04

外呼系统是怎么样的的简单介绍

本文目次一览： 1、外呼零碎是什么必修 2、德律风外呼零碎是什么意思什么是德律风外呼零碎 3、什么是外呼零碎？ 4、外呼...

11-25

山西电销机器人好用吗知乎（机器人电销怎么样）

本文目次一览： 1、德律风呆板人作用好欠好？ 2、电销呆板人有效吗？ 3、有谁用过电销呆板人？作用怎样样？德律风呆板...

11-25

珠海电销外呼系统有效果吗（电话外呼营销系统合法吗）

本篇文章给大家谈谈珠海电销外呼系统有效果吗，以及电话外呼营销系统合法吗对应的知识点，希望对各位有所帮助，不要忘...

05-16

天津教育电话软件办理多少钱,电话线路公司-总算知道

天津教育电话软件办理多少钱,电话线路公司电销系统机器人的使用也不只局限于电销行业，各行各业都可以使用电话机器人...

12-17

400电话加盟项目好做吗？

如果你生活中留心的话，会在很多广告中、企业介绍、广播电视中了解到400电话，这些电话一般都会用在企业的联系方式，客...

01-13

外呼系统怎么修改系统电话（电话外呼系统怎么安装）

本篇文章给大家谈谈外呼系统怎么修改系统电话，以及电话外呼系统怎么安装对应的知识点，希望对各位有所帮助，不要忘了...

05-05

智能电话机器人的功能（打电话的智能机器人）

本篇文章给大家谈谈智能电话机器人的功能，以及打电话的智能机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本...

03-11

工行上海分行“四合一”客户服务系统

前言 “四合一”客户服务系统是目前国内较先进的一套综合企业银行服务系统，该系统产生于 1996 年 7 月，由中国光大电脑...

10-22

深圳电销卡不封卡为什么会封号

深圳电销卡不封卡为什么会封号使用方便，电销卡不封号使用方便是主要的，办理电销卡在我们日常生活中其实很简单，比...

12-16

联通加速布局物联网建设

在如此大规模的市场“蛋糕”上，中国联通也在加速布局物联网产业。在近日召开的“中国联通物联网生态大会”上，来自物...

10-13

海尔客户服务系统

今年10月，海尔集团建成了自己的全国广域网，用于收集海尔在全国各地的电话中心及售后服务中心的客户信息，特别是建起...

10-22

湛江市好用防封电话卡便宜

2020年中国通信网络运维服务高级研讨会在京召开。本次大会由中国通信企业协会通信网络运营专业委员会主办，以“5G智慧物...

04-01

增强Linux和Unix服务器安全性的方法详解

网络安全是一个十分主要的课题，而服务器是网络安全中最主要的环节。Linux被以为是一个比拟安全的Internet服务器，作为一...

10-16

商标固有显著性与获得显著性

承接：商标显著性案例最高人民法院提出“应从相关公众的通常认识,从整体上对商标是否具有显著特征进行判断”,但未说明...

10-23

亳州市电话机器人培训中心（亳州市电话机器人培训中心招聘）

本文目录一览：1、想学工业机器人,有没有靠谱一些的机构啊?2、没有用的比较好的电话机器人啊?求介绍!现在的招电销员太难...

06-19

日本强震震撼中国的服务外包产业

CTI论坛(ctiforum)4月18日消息（编译/刘煜）根据一项最新的国际数据公司（以下简称IDC）调查研究显示，日本的这次灾难性事件...

10-19

400业务办理400电话服务商哪个好

选择400电话申请是因为有很多具体的增值服务。通常，您还可以看到在理解过程中需要选择哪些项目，或者在使用过程中需...

01-12

最全50个Mysql数据库查询练习题

此数据库查询语句是网络上50个数据库查询练习题目，网上有些版本是oracle语句写的，大多数公司还是用免费的mysql数据库，...

10-18

包含保定不记名电销卡的词条

今天给各位分享保定不记名电销卡的知识，其中也会对进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在...

08-28

做电话营销如果碰到障碍怎么办？

当业务员遇到的客户是具有一定身份和级别的人时，那么就很有可能遇到一种情况，对方的电话号码根本无法接通到对方本人...

12-04

巴黎求救电话年呼210万次 96%属误打 --消防队除报警「污染」12小时过滤假呼

法国消防、紧急救助电话号码是「18」和「112」。巴黎消防大队6月25日召开了记者招待会，根据2013年的接线统计记录，一年里...

10-19

西安的外呼系统（陕西外呼公司）

本篇文章给咱们谈谈西安的外呼体系，以及陕西外呼公司对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。本文...

11-07

新媒体电销机器人好用吗（电销机器人为什么不受欢迎）

本文目录一览： 1、电销机器人有用吗？2、电话机器人好用吗，有什么优势？3、请问电销机器人真的好用吗？用过的来4、电...

11-27

话机世界电销卡专卖

话机世界电销卡办理，找恒升通讯，主页有恒升通讯联系方式，话机世界电销卡白名单电话卡防封电销卡高频稳定高频不...

12-11

400电话续费每年多钱400电话要收多少费

(400电话400电话代理续费每年多钱)(400电话要收多少费)以下内容由巨人小编整理发布。 400电话预存话费：400电话预存费用的是...

01-12

福州财税外呼系统哪家好,电话营销系统批发-浅析

福州财税外呼系统哪家好,电话营销系统批发我知道有一语培训公司，前面大概花一千万做推广，抓了一批新客户注册数据，...

12-16

南京市外呼系统的简单介绍

今天给各位分享南京市外呼系统的知识，其中也会对进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开...

05-16

智能语音平台质检系统好用吗?

语音识别、语音合成、声纹识别技术，可以将一个人的声音转化为另一个人的声音，将其变成另一个人。而智能语音平台作为...

07-13

常州知识产权电销软件费用,呼叫中心软件办理多少钱-意味深长

常州知识产权电销软件费用,呼叫中心软件办理多少钱就可能多成交几单。人工打电话还是用系统，资源都是一样的。不过，...

12-16

中国移动拨打400电话收费吗400电话申请中怎样选择号码？怎样选择代理商？

中国移动400电话，包括4001.4007两个特别是4001段，属于起步不久的阶段，新号源.大量好号码可选，想办理400手机的企业抓住机...

01-12

什么是ai电话机器人（ai电话语音机器人）

本篇文章给大家谈谈什么是ai电话机器人，以及ai电话语音机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

11-06

perl数组的多数字下标示例代码

perl数组中正常的下标运算，想必大家都比较熟悉，这里不作说明。本文想说的是perl数组下标的多数字取值，可以极大的方便...

10-18

金华防封号系统

金华防封号系统 , 办理金华防封号系统 ,金华防封号系统如何办理国代卡商：星美乐语北纬分享华翔长城企信蓝猫等...

11-15

西安不标记呼叫中心系统案例-服务至上

西安不标记呼叫中心系统案例电话业务人员以及企业能利用拨号的时间设置自己的上班时间，确保在合适的时间段跟目标的客...

01-15

南京金融电销行业用什么电话销售卡

南京金融电销行业用什么电话销售卡，找华恒通讯，让您电销业绩翻倍！南京金融电销防封稳定高频通话稳定不封卡目前...

11-14

数控机床机器人优势汇总

山东康道智能资讯：数控机床机器人优势汇总。山东康道智能12年专注数控车床机器人,数控机床机器人等产品;种类齐全,品质...

10-24

怎么报装400电话企业安装400电话的优势很多

400电话是由10位数字组成的全国统一接入号。在企业宣传过程中，400电话无形中提升了公司的专业形象和强大的售后体系。...

01-12

利用shell命令统计日志的方法详解

10-18

本页收集关于利用shell命令统计日志的方法详解的相关信息资讯供网民参考！

四合一精品企业网站建设

多一个网站就为企业多增加一条营销渠道

¥888元限时抢购

立即咨询 快速购买

企业400电话

智能AI客服机器人
￥15000

在线订购

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

推荐文章

上一篇：Linux中的特殊符号与正则表达式

下一篇：Linux中的Syslog命令

一起分享吧

利用shell命令统计日志的方法详解

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

在线咨询