问题描述:
昨天运行ROS取数程序,发送端一共有512个进程,今天早上查看发送端的进程时:
[lhaaso@cmm03node06 ~]$ ps -ef |grep main |grep zengtx|wc -l 511
只剩下511个进程,经过查找,发现main 2 3430 0 192.168.251.166这个进程消失了。
接收端没有报错,事例率陡降为0。
查看freepage:只有511个dataChannel: 447个通道的freepage为0,64个通道的freepage为499或500
[lhaaso@cmm03node01 partitions]$ grep -v "freePages 0" buffer.txt |wc -l 64 [lhaaso@cmm03node01 partitions]$ grep "freePages 0" buffer.txt |wc -l 447
看起来好像是发送端的问题,接收端的表现属于正常,但是为啥发送端的程序会挂呢?
刚刚运行了一个小时,又出现了同样的问题:
[lhaaso@cmm03node01 partitions]$ grep " freePages 0" buffer.txt |wc -l 448 [lhaaso@cmm03node01 partitions]$ grep -v " freePages 0" buffer.txt |wc -l 64 [lhaaso@cmm03node01 partitions]$ vi lastL1IdInput.txt [lhaaso@cmm03node01 partitions]$ grep "lastL1IdInput 4294967295" lastL1IdInput.txt |wc -l 453 [lhaaso@cmm03node01 partitions]$ grep -v "lastL1IdInput 4294967295" lastL1IdInput.txt |wc -l 59
[lhaaso@cmm03node06 ~]$ ps -ef |grep main|grep zengtx|wc -l 512
查看log文件没有报错。