[20250606]跟踪library cache lock/library cache pin使用systemtap.txt
跟踪library cache lock/library cache pin使用systemtap.txt--//以前写过跟踪library cache lock/library cache pin使用gdb,今天尝试使用SystemTap(stap)。
--//首先声明一点,我不熟悉这些调试跟踪工具,一边通过上网查询资料一边编写完成:
--//SystemTap(stap)简单介绍如下:
SystemTap(stap) 是一个用于动态调试 Linux 系统的脚本语言和工具,以下是关于它的详细介绍:
基本概念
定义 :SystemTap 是一个免费、开源的工具,它允许用户编写脚本以动态地探测和监控运行中的 Linux 系统,包括内核和用户空间的应
用程序,无需重新编译或修改目标软件。
组成 :主要包括系统tap语言和stap命令行工具。其中,stap 是 SystemTap 的前端程序,用于接受探测指令、翻译脚本、生成和编译内
核模块,并将生成的内核模块加载到正在运行的 Linux 内核中以执行系统跟踪或探测功能。
主要特点
动态性 :无需重启系统或重新编译内核,即可动态插入和移除探测器,对系统运行影响小。
强大功能 :能访问内核数据结构、函数参数和返回值等,可详细分析系统性能瓶颈、安全漏洞等。
易用性 :脚本语言类似 C 和 awk,有丰富函数库,且红帽等发行版提供良好支持和集成,方便安装和使用。
工作原理
1. 脚本编写 :用户使用 SystemTap 脚本语言编写脚本,脚本中指定了要探测的内核事件或用户空间应用程序事件,以及相应的处理逻辑。
2. 脚本翻译 :stap 命令将脚本翻译成 C 代码,并生成一个内核模块,这个模块与 SystemTap 运行时库链接。
3. 模块加载与执行 :生成的内核模块被加载到正在运行的 Linux 内核中,系统会安排该模块与内核交互,执行探测任务,如数据采集等。
4. 数据输出与清理 :探测任务完成,采集的数据会输出到屏幕或指定文件中,staprun 命令会卸载模块并清理相关资源。
1.环境:
SYS@book> @ver1
PORT_STRING VERSION BANNER
------------------------------ -------------- --------------------------------------------------------------------------------
x86_64/Linux 2.4.xx 11.2.0.4.0 Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production
2.编写stp脚本:
--//首先确定oracle执行文件的全路径:
$ which oracle
/u01/app/oracle/product/11.2.0.4/db_1/bin/oracle
$ cat lkpn11g.stp
global lk=0, pn=0
#globak off_set=0
probe begin {
printf("Begin.\n")
}
probe process("/u01/app/oracle/product/11.2.0.4/db_1/bin/oracle").function("kgllkal")
{
printf("spid=%d :%s lk_count %d -- handle address: %x , mode = %d , kglnaobj : %s\n", pid(), ppfunc(),++lk, long_arg(2),long_arg(3),user_string(long_arg(2)+0x1a8));
}
probe process("/u01/app/oracle/product/11.2.0.4/db_1/bin/oracle").function("kglpnal")
{
printf("spid=%d :%s pn_count %d -- handle address: %x , mode = %d , kglnaobj : %s\n", pid(), ppfunc(),++pn, long_arg(2),long_arg(3),user_string(long_arg(2)+0x1a8));
# printf("%d\t%s: %s %x %x %d\n", pid(), execname(), ppfunc(), int_arg(1),long_arg(2),long_arg(3));
}
--//简单说明获取的参数2就是相应对象的句柄地址,参数3时mode。
--//参数2加上一个偏移0x1a8地址指向的内容就是对象的具体内容。使用user_string转换为字符串,好像遇到\0结束。
--//11g的偏移是0x1a8,21c的偏移是0x1c8,也许各个版本的偏移也许数值不同可以通过oradebug peek确定。
3.测试:
--//首先执行desc dept,Select * from dept where deptno=40;多次,主要目的避免大量的递归语句。
--//注意Select第1个字母大写。
SCOTT@book> @ spid
==============================
SID : 133
SERIAL# : 7
PROCESS : 3444
SERVER : DEDICATED
SPID : 3445
PID : 26
P_SERIAL# : 3
KILL_COMMAND : alter system kill session '133,7' immediate;
PL/SQL procedure successfully completed.
--//记下进程号3445,然后打开新的终端,注意以root用户执行如下:
--//一个简单的技巧,先以oracle用户登录,然后执行su root登录root用户(注意没有中间的-),这样执行sqlplus不需要输入全路径。
# stap -v /home/oracle/study/202501/lkpn11g.stp -x 3445 --tmpdir=/tmp
Pass 1: parsed user script and 138 library scripts using 238648virt/49176res/3240shr/46624data kb, in 410usr/20sys/437real ms.
Pass 2: analyzed script: 4 probes, 6 functions, 4 embeds, 4 globals using 304800virt/116456res/4408shr/112776data kb, in 580usr/90sys/680real ms.
Pass 3: using cached /root/.systemtap/cache/ef/stap_ef74e607e0915fa29ac8260dd2b00726_11665.c
Pass 4: using cached /root/.systemtap/cache/ef/stap_ef74e607e0915fa29ac8260dd2b00726_11665.ko
Pass 5: starting run.
Begin.
--//然后切换到oracle会话执行sql语句:
SCOTT@book> select * from dept where deptno=40;
DEPTNO DNAME LOC
---------- ------------------------------ -------------
40 OPERATIONS BOSTON
--//s小写
SCOTT@book> select * from dept where deptno=40;
DEPTNO DNAME LOC
---------- ------------------------------ -------------
40 OPERATIONS BOSTON
SCOTT@book> select * from dept where deptno=40;
DEPTNO DNAME LOC
---------- ------------------------------ -------------
40 OPERATIONS BOSTON
SCOTT@book> select * from dept where deptno=40;
DEPTNO DNAME LOC
---------- ------------------------------ -------------
40 OPERATIONS BOSTON
SCOTT@book> @ hash
HASH_VALUE SQL_ID CHILD_NUMBER KGL_BUCKET PLAN_HASH_VALUE HASH_HEX SQL_EXEC_START SQL_EXEC_ID
---------- ------------- ------------ ---------- --------------- ---------- ------------------- -----------
3912471479 14ymr4znm74xr 0 103351 2852011669 e93393b7 2025-06-06 10:13:07 16777220
--//第1次执行
spid=3445 :kgllkal lk_count 1 -- handle address: 8887bc30 , mode = 1 , kglnaobj : select * from dept where deptno=40
spid=3445 :kglpnal pn_count 1 -- handle address: 8887bc30 , mode = 2 , kglnaobj : select * from dept where deptno=40
spid=3445 :kgllkal lk_count 2 -- handle address: 8f980a08 , mode = 2 , kglnaobj : bookSYS
spid=3445 :kgllkal lk_count 3 -- handle address: 8887b920 , mode = 2 , kglnaobj : 127a7727e93393b7$BUILD$
spid=3445 :kgllkal lk_count 4 -- handle address: 8887b7b0 , mode = 1 , kglnaobj : --//没有显示
spid=3445 :kglpnal pn_count 2 -- handle address: 8887b7b0 , mode = 3 , kglnaobj : --//没有显示
spid=3445 :kgllkal lk_count 5 -- handle address: 8f980a08 , mode = 2 , kglnaobj : bookSYS
spid=3445 :kgllkal lk_count 6 -- handle address: 85fa5890 , mode = 1 , kglnaobj : 79ab1de2f29642c4127a7727e93393b7Child:0
spid=3445 :kglpnal pn_count 3 -- handle address: 85fa5890 , mode = 3 , kglnaobj : 79ab1de2f29642c4127a7727e93393b7Child:0
spid=3445 :kgllkal lk_count 7 -- handle address: 87bd2b18 , mode = 1 , kglnaobj : SCOTT
spid=3445 :kgllkal lk_count 8 -- handle address: 8f980a08 , mode = 2 , kglnaobj : bookSYS
spid=3445 :kgllkal lk_count 9 -- handle address: 87aa23c0 , mode = 2 , kglnaobj : DEPTSCOTT
spid=3445 :kglpnal pn_count 4 -- handle address: 87aa23c0 , mode = 2 , kglnaobj : DEPTSCOTT
--//第2次执行
spid=3445 :kgllkal lk_count 10 -- handle address: 8887bc30 , mode = 1 , kglnaobj : select * from dept where deptno=40
spid=3445 :kgllkal lk_count 11 -- handle address: 8887b7b0 , mode = 1 , kglnaobj : --//没有显示
spid=3445 :kgllkal lk_count 12 -- handle address: 87aa23c0 , mode = 2 , kglnaobj : DEPTSCOTT
spid=3445 :kglpnal pn_count 5 -- handle address: 87aa23c0 , mode = 2 , kglnaobj : DEPTSCOTT
--//第3次执行
spid=3445 :kgllkal lk_count 13 -- handle address: 8887bc30 , mode = 1 , kglnaobj : select * from dept where deptno=40
spid=3445 :kgllkal lk_count 14 -- handle address: 8887b7b0 , mode = 1 , kglnaobj : --//没有显示
--//这里实际上子游标的句柄,大部分情况下显示乱码,实际上对象在父游标句柄里面。
--//第4次执行
--//没有输出:
SYS@book> @ sharepool/shp4 14ymr4znm74xr ''
HANDLE_TYPE KGLHDADR KGLHDPAR C40 KGLHDLMD KGLHDPMD KGLHDIVC KGLOBHD0 KGLOBHD6 KGLOBHS0 KGLOBHS6 KGLOBT16 N0_6_16 N20 KGLNAHSH KGLOBT03 KGLOBT09
---------------------- ---------------- ---------------- ---------------------------------------- ---------- ---------- ---------- ---------------- ---------------- ---------- ---------- ---------- --------- ---------- ---------- ------------- ----------
child handle address 000000008887B7B0 000000008887BC30 select * from dept where deptno=40 1 0 0 0000000085FA5AC8 000000008574A770 4528 12144 3067 19739 19739 3912471479 14ymr4znm74xr 0
parent handle address 000000008887BC30 000000008887BC30 select * from dept where deptno=40 1 0 0 000000008887BB78 00 4720 0 0 4720 4720 3912471479 14ymr4znm74xr 65535
--//注意KGLHDADR就是句柄地址,与stp的输出可以对上。
--//关于lock pin的地址这部分内容以后完善看看。
--//kglGetSO to allocate the library cache state object. kglGetSO returns the lock address.
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页:
[1]