下篇见调试技巧2。
Debug Hacks
作者为吉冈弘隆、大和一洋、大岩尚宏、安部东洋、吉田俊辅,有中文版《Debug
Hacks中文版—深入调试的技术和工具》。这本书涉及了很多调试技巧,对调试器使用、内核调试方法、常见错误的原因,还介绍了systemtap
、strace
、ltrace
等一大堆工具,非常值得一读。
话说我听说过的各程序设计课程似乎都没有强调过调试的重要性,把调试当作单独一节课来上(就算有估计也上不好),很多人都只会printf
调试法,breakpoint都很少用,就不提conditional
breakpoint、watchpoint、reverse
execution之类的了。也看到过很多同学在调试上浪费了很长很长的时间。
下面是篇review,也包含了一些我自己整理的一些调试技巧。
折腾工具
继续牢骚几句,我接触过的人当中感觉最执着与折腾工具的人只有两个,ppwwyyxx和xiaq,他们是少有的能把折腾工具当作正经工作来做的人。
很久以前我还会到处在网上搜索好的实用工具,尤其是那些CLI程序,比如renameutils
、xsel
、recode
、the_silver_searcher
,查阅文档定制自己的配置文件。但这么做花费的时间太多。后来就想我可以搜索一些善于折腾的人的配置文件,关注他们修改了哪些地方,我的配置只要取众家之所长就可以了。
先厚颜自荐一下我的配置。下面的用户列表就是我找到的在GitHub上把dotfiles
配置地井井有条的人(如果GitHub支持按照项目的大小排序,列表搜集就能省很多麻烦了):
1 | alejandrogomez bhj craigbarnes dotvim hamaco joedicastro laurentb ok100 pyx roylez sjl trapd00r vodik w0ng |
有了上述的dotfiles
,其他人的dotfiles
大多都不愿看了。但是五岳归来不看山,黄山归来不看岳,ppwwyyxx
的dotfiles感觉与之前诸位相比更胜一筹。
无关的话到此结束,下面是正文:
gdb
记录历史
把下面几行添加到~/.gdbinit
中吧,gdb
启动时会自动读取里面的命令并执行:
1 | set history save on |
我习惯在~/.history
堆放各个历史文件。有了历史,使用readline
的reverse-search-history (C-r)
就能轻松唤起之前输入过的命令。
修改任意内存地址的值
1 | set {int}0x83040 = 4 |
显示intel风格的汇编指令
1 | set disassembly-flavor intel |
断点在function prologue前
先说一下function prologue吧,每个函数最前面一般有三四行指令用来保存旧的帧指针(rbp),并腾出一部分栈空间(通常用于储存局部变量、为当前函数调用其他函数腾出空间存放参数,有时候还会存储字面字符串,当有nested function时也会用于保存当前的栈指针)。
在x86-64环境下典型的funcition prologue长成这样:
1 | push rbp |
可能还会有and
指令用于对齐rsp
。如果编译时加上-fomit-frame-pointer
(Visual
Studio中文版似乎译作“省略框架指针”),那么生成的指令就会避免使用rbp
,function
prologue就会简化成下面一行:
1 | sub rsp, 0x10 |
设置断点时如果使用了b *func
的格式,也就是说在函数名前加上*
,gdb
就会在执行function
prologue前停下,而b func
则是在执行function
prologue后停下。参考下面的会话:
1 | % gdb a.out |
Checkpoint
gdb
可以为被调试的程序创建一个快照,即保存程序运行时的状态,等待以后恢复。这个是非常方便的一个功能,特别适合需要探测接下来会发生什么但又不想离开当前状态时使用。
ch
是创建快照,d c ID
是删除指定编号的快照,i ch
是查看所有快照,restart ID
是切换到指定编号的快照,详细说明可以在shell里键入info '(gdb) Checkpoint/Restart'
查看。
1 | % gdb ./a.out |
上面的会话中先用ch
创建了一个快照,紧接着a
被修改为了3,随后用restart 1
恢复到编号为1的快照,继续运行程序可以发现a
仍然为原来的值0。
以色列的Haifa Linux
club有一次讲座讲gdb
,讲稿值得一看:http://haifux.org/lectures/210/gdb_-_customize_it.html
逆向技术
Long Le的peda很不错,感觉比http://reverse.put.as的https://github.com/gdbinit/Gdbinit好用。
gcc
Mudflap
使用了compile-time
instrumentation(CTI)的工具。编译时加上-fmudflap -lmudflap
选项即可,会在很多不安全代码生成的指令前加上判断合法性的指令。
1 | % echo 'int main() { int z[1]; z[1] = 2; }' | cc -xc - -fmudflap -lmudflap |
第一行用-xc -
让cc
从标准输入读源代码,并当作C来编译。接来下执行./a.out
,可以看到运行时程序报错了。
使用MUDFLAP_OPTIONS
环境变量可以控制Mudflap的运行期行为,具体参见Mudflap Pointer
Debugging。
AddressSanitizer
和Mudflap类似的工具,clang
和gcc
可以加上选项-fsanitize=address
使用,比如:
1 | clang -fsanitize=address a.c |
如果想在出错的地方断点停下来,可以用gdb
打开,输入b __asan_report_store1
回车,再输入r
回车运行程序。
-ftrapv
这个选项是调试有符号整型溢出问题的利器。在i386环境下,gcc会把int32_t
运算编译成call __addvsi3
,__addvsi3
函数会在运行时检查32位有符号加法运算是否产生溢出,如果是则调用abort
函数中止程序。减法、乘法和取反运算也有类似的运行时函数检查溢出,另外也有64位版本的__addvdi3
等函数。但不存在对无符号整型的溢出检测函数。比如下面这些代码均会触发trap:
1 | int a = INT_MAX; a++; |
这段代码来自gcc
项目目录的libgcc/libgcc2.c
:
1 |
|
但注意在x86-64环境下-ftrapv
只检查64位溢出。考虑下面这段代码:
1 |
|
在x86-64下用gcc
编译运行,输出barrier
后才会执行abort
使程序中止,因为int32_t
的溢出不会触发trap。
clang
也有-ftrapv
,在x86-64环境下对于int32_t
的溢出也能触发trap。
_FORTIFY_SOURCE
gets
、strcpy
这类函数容易造成stack
mashing。gcc
编译时如果指定了-D_FORTIFY_SOURCE=1
,生成的汇编程序中这些不安全的函数调用会被替代为libc.so
中名字类似__gets_chk
的一类安全函数,会在运行期检查是否产生了缓冲区溢出。比如,下面的代码会在运行时报错:
1 |
|
Gentoo
Portage从gcc-4.3.3-r1
开始默认开启_FORTIFY_SOURCE
标志了,好多发行版都开启了,测试发现Arch
Linux的gcc
似乎没有。shell里执行下面代码就可以看到Gentoo里是怎么定义_FORTIFY_SOURCE
的了:
1 | echo -e '#undef __OPTIMIZE__\nmain() { printf("%d\\n", _FORTIFY_SOURCE); }' | cpp |
也就是当优化等级在-O1
或以上时_FORTIFY_SOURCE
会生效,名字为__$func_chk
模式的函数会被使用。这种做法造成了一些麻烦,比如suricata
git
tree里的src/suricata.c
使用了#ifdef _FORTIFY_SOURCE
,会造成编译无法通过。
-fstack-protector
-fstack-protector -fstack-protector-all gcc 4.8.1 -fstack-protector-strong
https://securityblog.redhat.com/2013/10/23/debugging-stack-protector-failures/
开启Stack-Smashing Protector (SSP)。我的理解是在储存的帧指针(rbp)前写入一个magic number,函数返回的时候检查下这个magic number是否被改动,如果是就可能产生stack smashing了。这个方法的footprint最小,但是保护力度也比较弱。
IA32
1 | function prologue |
x86-64
1 | function prologue: |
execinfo.h
提供了int backtrace (void **buffer, int size)
、char ** backtrace_symbols (void *const *buffer, int size)
在程序运行时查看函数调用栈。参见http://www.gnu.org/software/libc/manual/html_node/Backtraces.html。
Misc
Valgrind
一系列调试和profiling工具的套件,其中的Memcheck是一个使用了dynamic
binary instrumentation(DBI)的工具,
在程序指令间插入自己的指令检查validity和addressablity。另外Memcheck替换了标准的malloc
,这样就可以检测出off-by-one
error、double free、内存泄漏等许多问题。
Memcheck引入的footprint极小,无需重编译程序,也没有繁琐的配置。比如原来是用./a.out
执行程序,需要Memcheck时就换成valgrind ./a.out
。
在程序访问某一内存地址时Memcheck会检查是否有越界之类的错误,Memcheck能诊断出大量但不是全部的访问错误,比如下面这样有问题的代码就没法检查出来:
1 | int main() |
因为a[1992]
的地址在栈上,允许访问。
Valgrind启动时会读取~/.valgrindrc
,对于memcheck
我配置了下面这几行:
1 | --memcheck:leak-check=yes |
valgrind --vgdb-error=0 --vgdb=yes
很强大,可以在进程遇到错误时让gdb
调试。
strace
记录程序执行的系统调用和收到的信号,和valgrind
类似,使用非常简单:
1 | strace ./a.out |
有一些选项可以attach到现有进程上去(-p)、记录时刻(-t)、统计系统调用使用次数(-c)、过滤特定的系统调用(-e)等。
带上-c
选项可以统计系统调用的使用次数:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28% strace -c ls
chap04 chap05 chap06 chap07 chap08 chap09 chap10 chap11 chap12 chap13 chap14 chap15 chap16 chap17
% time seconds usecs/call calls errors syscall
------ ----------- ----------- --------- --------- ----------------
0.00 0.000000 0 5 read
0.00 0.000000 0 1 write
0.00 0.000000 0 7 open
0.00 0.000000 0 10 close
0.00 0.000000 0 8 fstat
0.00 0.000000 0 20 mmap
0.00 0.000000 0 12 mprotect
0.00 0.000000 0 2 munmap
0.00 0.000000 0 3 brk
0.00 0.000000 0 2 rt_sigaction
0.00 0.000000 0 1 rt_sigprocmask
0.00 0.000000 0 2 ioctl
0.00 0.000000 0 1 1 access
0.00 0.000000 0 1 execve
0.00 0.000000 0 1 fcntl
0.00 0.000000 0 2 getdents
0.00 0.000000 0 1 getrlimit
0.00 0.000000 0 1 arch_prctl
0.00 0.000000 0 2 1 futex
0.00 0.000000 0 1 set_tid_address
0.00 0.000000 0 1 openat
0.00 0.000000 0 1 set_robust_list
------ ----------- ----------- --------- --------- ----------------
100.00 0.000000 85 2 total
-e
选项只跟踪指定系统调用:
1 | % strace -e read,open ls |
使用strace
还可以做一些很可怕的事,比如有root
权限的情况下嗅探sshd
以得到其他尝试SSH登录的用户的密码:SSHD
password sniffing。
-p
很有用,比如调试CGI
wrapperfcgiwrap
,观察它的输出:
1 | strace -s200 -p$(pidof -s fcgiwrap) -e write |
ltrace
记录程序调用的动态库中的函数。名字和strace
很像,使用方式和很多命令行选项也如出一辙。
查看echo test
1 | % ltrace echo test |
Ltrace
Internals描述了ltrace
的实现机制。
SystemTap
SystemTap提供了一套底层工具用于trace/probe。用户编写SystemTap
script语言的程序,SystemTap将其翻译为C代码,再编译成临时的内核模块。内核模块加载时SystemTap
script脚本里的hook就会在特定event发生时执行。当SystemTap脚本停止运行时,相应的hook就被删除,移除临时的内核模块。这一整套流程都是通过一个简单的CLI程序stap
驱动的。
SystemTap使用前的配置过程比较复杂,需要特制的内核,开启CONFIG_KPROBES=y
、CONFIG_DEBUG_INFO=y
等诸多内核编译选项。
比如如下的简单脚本就能显示各进程调用net/socket.c
内函数的情况:
1 | probe kernel.function("*@net/socket.c").call { |
perf
1 | perf record -e probe_a:main -e probe_a:main_1 /home/ray/tmp/a |
可执行文件不能在tmpfs分区。
1 | A=~/tmp; cc -xc <(echo 'main(){}') -Wl,-rpath,$A -o a && sudo perf probe -d '*' || :; sudo perf probe -x $A/libc.so.6 malloc && sudo perf record -e probe_libc:malloc -aR ./a && sudo perf report -n |
其他
书里还介绍了很多神奇的玩意儿,比如kaho
,用于读取被编译器优化掉的变量;livepatch
,运行时动态修改变量、替换函数等。这两个工具我在网上检索了下,感觉是个proof
of
concept的东西,也没有更新了。不够这些思路很奇特,想到了并试图去解决调试时常受困扰的问题,很棒。