最近心血来潮,我希望能写一个通用的代码分析工具(其实这个词有点太。事实上为C代码)。看到这几天我看到代码头晕眼花,尽管Source Insight救命,仍然没有足够的智慧思考很多地方。
如今主要遇到的问题有下面几个:
1。非常多函数被定义为宏,然后被调用。
这个就须要自己搜索到对应的定义。然后再去寻找调用处。
2,程序的结构中非常多用到有限状态机,函数会被放到数组中。
会遇到和上面相同的问题。
3。现有的工具无法展示全部函数的调用和被调用关系,让看代码总是盲人摸象,难免会出现疏漏。
所以希望能自己写一个代码分析的工具。能够帮助更快,更清晰的分析代码。如今初步计划使用Python开发,毕竟第三方库多些,开发比較方便。本帖作为项目開始的处女帖,也相当于给自己的项目开个头。
如今有了一些基本想法,罗列例如以下:
须要实现的功能:
1。分析各个C文件里的函数(须要一定的文本分析算法来推断来定位和区分函数定义和函数调用)并存储起来。
2,利用有向图的方式来存储函数见的关系(调用和被调用),通过邻接链表的结构来存储。
3。假设某个函数没有被调用。推断其是否被替换(定义为宏或成为数组元素),并进行对应处理。
分析代码第一步:建立函数调用关系链表。
伪代码:
while(不是最后一个文件里的最后一个函数)
{
current_function=通过文本分析得到的函数名称
为current_function填加子节点(分析current_function中调用的函数)
if(current_function在图中已有存储)
{
刚才建立的链表放入到图中current_function所在的位置。
}
else
{
current_function作为顶级节点放入到图中
}
}
清理顶级节点(解决上面提出的第三个问题。)
分析代码第二步:显示current_function的调用关系。
函数调用关系图建立完毕后,假设要显示current_function的调用关系,仅仅需对图以current_function为起点进行遍历就可以。
如今我仅仅是到了上面的几个方面。接下来肯定实现所遇到这么多问题。我相信,办法总比困难多。加油。
版权声明:本文博客原创文章,博客,未经同意,不得转载。