Linux 文件内容查看与文本处理实用指南

Linux 文件内容查看与文本处理实用指南 | 极客日志

cat

more/less

# 显示单个文件内容
cat 文件名

# 合并多个文件并显示
cat 文件 1 文件 2 > 合并文件

# 显示文件并带行号
cat -n 文件名

# 压缩连续空行
cat -s 文件名

# 从标准输入读取内容（等价于直接显示文件）
cat < 文件名

# 逆序显示文件内容
tac 文件名

# 示例：对 test.txt 进行逆序显示
tac test.txt

# 分屏查看文件
more 文件名

# 带行号分屏查看
more -n 文件名

# 从第 10 行开始查看
more +10 文件名

# 用 less 查看文件
less 文件名

# 显示行号
less -N 文件名

# 忽略大小写搜索
less -i 文件名

# 查看文件前 10 行（默认）
head 文件名

# 查看前 20 行
head -n20 文件名

# 查看前 500 字节
head -c500 文件名

# 查看文件后 10 行（默认）
tail 文件名

# 查看后 20 行
tail -n20 文件名

# 实时追踪文件更新（如日志）
tail -f 文件名

# 追踪并显示最新 10 行
tail -fn10 文件名

tail -f /var/log/nginx/access.log

# 打开文件编辑（不存在则创建）
nano 文件名

# 示例：编辑配置文件
nano config.ini

echo "include /usr/share/nano/*.nanorc" > ~/.nanorc

# 覆盖写入文件（无则创建，有则清空）
命令 > 文件名

# 示例：将 ls 结果写入文件
ls -l > file_list.txt

# 清空文件内容（不执行命令）
> 文件名

# 追加内容到文件
命令 >> 文件名

# 示例：追加日期到日志文件
echo "$(date)" >> access.log

# 重定向错误输出到文件
命令 2> 错误文件

# 同时重定向正确和错误输出
命令 > 正确文件 2> 错误文件

# 合并正确和错误输出到同一文件
命令 &> 日志文件

# 从文件读取输入
命令 < 文件名

# 示例：将文件内容作为 bc 的输入
bc < calc.txt

# 示例 1：过滤包含 "error" 的日志行
cat app.log | grep "error"

# 示例 2：查看当前目录下最大的 5 个文件
ls -lS | head -n5

# 示例 3：统计文件行数
cat file.txt | wc -l

# 在文件中搜索字符串
grep "搜索词" 文件名

# 示例：搜索配置文件中的端口号
grep "port" /etc/httpd/conf/httpd.conf

# 不区分大小写搜索
grep -i "SEARCH" 文件名

# 显示行号
grep -n "搜索词" 文件名

# 使用扩展正则表达式
grep -E "模式" 文件名

# 示例 1：匹配以数字开头的行
grep -E "^[0-9]" 文件名

# 示例 2：匹配 IP 地址
grep -E "\b(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b" 日志文件

# 排除包含指定字符串的行
grep -v "排除词" 文件名

# 示例：查看非错误日志
grep -v "error" app.log

# 匹配多个模式中的任意一个
grep -e "模式 1" -e "模式 2" 文件名

# 示例：搜索 info 或 warning 日志
grep -e "info" -e "warning" app.log

# 在目录中递归搜索
grep -r "搜索词" 目录名

# 示例：在项目中搜索特定函数
grep -r "processData" src/

sed 's/旧字符串/新字符串/g' 文件名

awk '{print $1}' access.log | sort | uniq -c | sort -nr

# 示例：过滤日志并统计 IP 访问量
grep "2025-05-29" access.log | awk '{print $1}' | sort | uniq -c | sort -nr

# 转换文件编码
iconv -f 源编码 -t 目标编码 输入文件 -o 输出文件

# 示例：将 UTF-8 文件转为 GBK
iconv -f utf-8 -t gbk file.txt -o file_gbk.txt

grep "/api/user" access.log | wc -l

grep "2025-05-29 10:00" app.log

sed -i.bak 's/Port 80/Port 8080/g' /etc/httpd/conf/httpd.conf

jq '.users[].name' data.json

find . -name "*.log" | xargs -P 4 grep "error"

split -l100000 bigfile.txt part_
for f in part_*; do grep "pattern" "$f"; done

# 1. 查看今天的访问日志
tail -f /var/log/nginx/access.log

# 2. 统计 Top 10 访问 IP
awk '{print $1}' /var/log/nginx/access.log | sort | uniq -c | sort -nr | head -n10

# 3. 分析慢请求（>500ms）
grep "ms\" > 500" /var/log/nginx/access.log | awk '{print $7, $11}' | sort -k2 -nr

# 1. 备份所有.py 文件
find . -name "*.py" -exec cp {} {}.bak \;

# 2. 将文件中的旧函数名替换为新函数名
find . -name "*.py" -exec sed -i 's/old_function/new_function/g' {} \;

# 3. 检查修改结果
grep -r "old_function" .

# 1. 切割当前日志
mv /var/log/app.log /var/log/app.log.`date +%Y%m%d`

# 2. 生成新日志文件
touch /var/log/app.log

# 3. 压缩一周前的日志
find /var/log/ -name "app.log.*" -mtime +7 -exec gzip {} \;

Linux 文件内容查看与文本处理实用指南

引言

一、文件内容查看工具：从快速浏览到深度分析

1. cat：小文件查看

2. tac：逆向查看

3. more：大文件分屏查看器

4. less：增强版分屏查看器

5. head/tail：文件头尾内容提取

（1）head：查看文件头部

（2）tail：查看文件尾部

二、文本编辑与重定向：内容写入与输出控制

1. nano：极简文本编辑器

2. 重定向符号：输入输出方向控制

（1）标准输出重定向（>）

（2）追加输出重定向（>>）

（3）标准错误重定向（2>）

（4）输入重定向（<）

3. 管道符（|）：命令间的数据传递

三、正则表达式与文本过滤：grep 的强大威力

1. grep 基础：文本行过滤工具

2. 正则表达式基础：模式匹配规则

（1）字符匹配

（2）次数匹配

（3）位置匹配

3. 扩展正则表达式：-E 参数的使用

4. 高级过滤技巧

（1）反向匹配（-v）

（2）多个模式匹配（-e）

（3）递归搜索目录（-r）

四、扩展知识：文本处理进阶与实战技巧

1. 文本处理三剑客：sed、awk 与 grep

（1）sed：流编辑器

（2）awk：数据处理工具

（3）三剑客结合使用

2. 文本编码转换：iconv

3. 常见文本处理场景

（1）日志分析

（2）配置文件修改

（3）数据提取

4. 文本处理性能优化

（1）大文件处理技巧

（2）并行处理

（3）避免内存溢出

五、实战案例：文本处理综合应用

案例 1：分析 Nginx 访问日志

案例 2：批量修改文件内容

案例 3：日志切割与归档

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具