zoukankan      html  css  js  c++  java
  • coredump产生的几种可能情况

    coredump产生的几种可能情况

    造成程序coredump的原因有很多,这里总结一些比较常用的经验吧:

     1,内存访问越界

      a) 由于使用错误的下标,导致数组访问越界。

      b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符。

      c) 使用strcpy, strcat, sprintf, strcmp,strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。

     2,多线程程序使用了线程不安全的函数。

    应该使用下面这些可重入的函数,它们很容易被用错:

    asctime_r(3c) gethostbyname_r(3n) getservbyname_r(3n)ctermid_r(3s) gethostent_r(3n) getservbyport_r(3n) ctime_r(3c) getlogin_r(3c)getservent_r(3n) fgetgrent_r(3c) getnetbyaddr_r(3n) getspent_r(3c)fgetpwent_r(3c) getnetbyname_r(3n) getspnam_r(3c) fgetspent_r(3c)getnetent_r(3n) gmtime_r(3c) gamma_r(3m) getnetgrent_r(3n) lgamma_r(3m) getauclassent_r(3)getprotobyname_r(3n) localtime_r(3c) getauclassnam_r(3) etprotobynumber_r(3n)nis_sperror_r(3n) getauevent_r(3) getprotoent_r(3n) rand_r(3c) getauevnam_r(3)getpwent_r(3c) readdir_r(3c) getauevnum_r(3) getpwnam_r(3c) strtok_r(3c) getgrent_r(3c)getpwuid_r(3c) tmpnam_r(3s) getgrgid_r(3c) getrpcbyname_r(3n) ttyname_r(3c)getgrnam_r(3c) getrpcbynumber_r(3n) gethostbyaddr_r(3n) getrpcent_r(3n)

     3,多线程读写的数据未加锁保护。

    对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成coredump

     4,非法指针

      a) 使用空指针

      b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时就很容易因为bus error而core dump。

     5,堆栈溢出

    不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误。  

    六,利用gdb进行coredump的定位

      其实分析coredump的工具有很多,现在大部分类unix系统都提供了分析coredump文件的工具,不过,我们经常用到的工具是gdb。

      这里我们以程序为例子来说明如何进行定位。

    1,  段错误 – segmentfault

    Ø  我们写一段代码往受到系统保护的地址写内容。

    Ø  按如下方式进行编译和执行,注意这里需要-g选项编译。

    从红色方框截图可以看到,程序中止是因为信号11,且从bt(backtrace)命令(或者where)可以看到函数的调用栈,即程序执行到coremain.cpp的第5行,且里面调用scanf 函数,而该函数其实内部会调用_IO_vfscanf_internal()函数。

    接下来我们继续用gdb,进行调试对应的程序。

    记住几个常用的gdb命令:

    l(list) ,显示源代码,并且可以看到对应的行号;

    b(break)x, x是行号,表示在对应的行号位置设置断点;

    p(print)x, x是变量名,表示打印变量x的值

    r(run), 表示继续执行到断点的位置

    n(next),表示执行下一步

    c(continue),表示继续执行

    q(quit),表示退出gdb

     

    启动gdb,注意该程序编译需要-g选项进行。

    注:  SIGSEGV     11       Core    Invalid memoryreference

    七,附注:

    1,  gdb的查看源码

    显示源代码

    GDB 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上-g的参数,把源程序信息编译到执行文件中。不然就看不到源程序了。当程序停下来以后,GDB会报告程序停在了那个文件的第几行上。你可以用list命令来打印程序的源代码。还是来看一看查看源代码的GDB命令吧。

    list<linenum>

    显示程序第linenum行的周围的源程序。

    list<function>

    显示函数名为function的函数的源程序。

    list

    显示当前行后面的源程序。

    list -

    显示当前行前面的源程序。

    一般是打印当前行的上5行和下5行,如果显示函数是是上2行下8行,默认是10行,当然,你也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。

    setlistsize <count>

    设置一次显示源代码的行数。

    showlistsize

    查看当前listsize的设置。

    list命令还有下面的用法:

    list<first>, <last>

    显示从first行到last行之间的源代码。

    list ,<last>

    显示从当前行到last行之间的源代码。

    list +

    往后显示源代码。

    一般来说在list后面可以跟以下这些参数:

    <linenum>   行号。

    <+offset>   当前行号的正偏移量。

    <-offset>   当前行号的负偏移量。

    <filename:linenum>  哪个文件的哪一行。

    <function>  函数名。

    <filename:function>哪个文件中的哪个函数。

    <*address>  程序运行时的语句在内存中的地址。

    2,  一些常用signal的含义

    SIGABRT:调用abort函数时产生此信号。进程异常终止。

    SIGBUS:指示一个实现定义的硬件故障。

    SIGEMT:指示一个实现定义的硬件故障。EMT这一名字来自PDP-11的emulator trap 指令。

    SIGFPE:此信号表示一个算术运算异常,例如除以0,浮点溢出等。

    SIGILL:此信号指示进程已执行一条非法硬件指令。4.3BSD由abort函数产生此信号。SIGABRT现在被用于此。

    SIGIOT:这指示一个实现定义的硬件故障。IOT这个名字来自于PDP-11对于输入/输出TRAP(input/outputTRAP)指令的缩写。系统V的早期版本,由abort函数产生此信号。SIGABRT现在被用于此。

    SIGQUIT:当用户在终端上按退出键(一般采用Ctrl-/)时,产生此信号,并送至前台进

    程组中的所有进程。此信号不仅终止前台进程组(如SIGINT所做的那样),同时产生一个core文件。

    SIGSEGV:指示进程进行了一次无效的存储访问。名字SEGV表示“段违例(segmentationviolation)”。

    SIGSYS:指示一个无效的系统调用。由于某种未知原因,进程执行了一条系统调用指令,但其指示系统调用类型的参数却是无效的。

    SIGTRAP:指示一个实现定义的硬件故障。此信号名来自于PDP-11的TRAP指令。

    SIGXCPUSVR4和4.3+BSD支持资源限制的概念。如果进程超过了其软C P U时间限制,则产生此信号。

    SIGXFSZ:如果进程超过了其软文件长度限制,则SVR4和4.3+BSD产生此信号。

    3,  Core_pattern的格式

    可以在core_pattern模板中使用变量还很多,见下面的列表:

    %% 单个%字符

    %p 所dump进程的进程ID

    %u 所dump进程的实际用户ID

    %g 所dump进程的实际组ID

    %s 导致本次core dump的信号

    %t core dump的时间 (由1970年1月1日计起的秒数)

    %h 主机名

    %e 程序文件名

  • 相关阅读:
    整数的位数,及反转
    判断1~n有多少个1
    C语言常用字符串函数
    C语言类型转换原理
    printf()函数压栈a++与++a的输出
    49 丑数( 时间空间效率的平衡)
    42 连续子数组的最大和(时间效率)
    41 数据流中的中位数(时间效率)
    40 最小的K个数(时间效率)
    一、简介 ELO商户类别推荐有助于了解客户忠诚度
  • 原文地址:https://www.cnblogs.com/baiduboy/p/6830464.html
Copyright © 2011-2022 走看看