博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用grep命令查找字符串分析log文件的一次实践
阅读量:6801 次
发布时间:2019-06-26

本文共 591 字,大约阅读时间需要 1 分钟。

需求场景:

我需要分析一个服务器访问日志,分析百度蜘蛛这个月对求索网页面的抓取情况。

分析问题:

我的一个access.log文件大小有35M,不可能直接通过打开查看。我需要过滤掉一些没有的信息,只保留蜘蛛访问的信息行。

实践过程:

命令工具:

grep -n 'xxx' file > new file//grep参数解释://grep查找命令,-n表示行数,xxx表示某字符串, file 要查找的文件// > new file 导入到一个新的文件

1.利用grep字符串查找命令,筛选出这个月的数据。

grep -n 'Aug' access.log > Aug.log

2.继续筛选,把有百度蜘蛛标记的行找出。

grep -n 'Baiduspider' Aug.log > Aug_baiduspider.log

以上两条命令的得到的Aug_baiduspider.log数据就是我要的百度蜘蛛在这个月对我的服务器访问的日志记录。

一个从35M的信息中,直接获取了几kb我们有用的信息,排除其他行的干扰,我觉得是非常漂亮的一次应用。

结果对比图:

access.log截图:access.log

筛选的baiduspider访问截图baiduspider

像这样的命令对分析日志是非常有帮助的,大家可以举一反三,拓展更多的应用,比如,分析日志异常,筛选404,503等异常状态码的信息,及时高效的发现问题并解决之。

转载地址:http://wuywl.baihongyu.com/

你可能感兴趣的文章
sql server中filegroup与partition解析
查看>>
转 Spring.NET 与 NHibernate 的整合
查看>>
TNS-01190故障的处理
查看>>
C++ Exercises(十)
查看>>
《kali linux 渗透测试初级教程》免费下载
查看>>
[Oracle]PDB Clone 方法
查看>>
JavaScript词法作用域与调用对象
查看>>
当谈论设备指纹时,我们到底在说什么?(转)
查看>>
Python天天美味(10) - 除法小技巧
查看>>
webrtc进阶-信令篇-之三:信令、stun、turn、ice
查看>>
.NET调试实例-信息和安装说明 (原创翻译)
查看>>
ThinkPHP 数据库操作之数据表模型和基础模型 ( Model
查看>>
Listener and sqlnet trace
查看>>
Unity3D对安卓盒子的支持
查看>>
redis源码笔记 - redis-cli.c
查看>>
QTabWiget Change Color 改变颜色
查看>>
模板方法在Spring事务中的应用
查看>>
Ext.LoadMask遮罩的效果几种实现方式
查看>>
理解SQL SERVER中非聚集索引的覆盖,连接,交叉和过滤
查看>>
各个JAVA场景下的内存图
查看>>