为了避免进程发呆,或者陷入死循环,但是进程并没有真正挂死,导致软件看门狗没有监控得到进程挂死而重启。
所以,添加一个喂狗自愈机制。
time_t lastTime = time(NULL);
for(耗时功能处理)
{
//喂狗
if(time(NULL) – lastTime >= 120)
{
lastTime = time(NULL);
Feed(600,”taskman”); //将当前进程喂狗
LOG(DEBUG_K,”—- Feed dog —-
“);
}
}
#ifndef _SOFT_DOG_HPP_ #define _SOFT_DOG_HPP_ /////////////////////////////////////////////////////////////////////////// // // 由于原有方案是被监控程序清计数器,监控程序(软狗)加计数器,这种方案可能导致两个进程同时操作一个文件,出现难以 // 预料的问题。因此,改成一个进程写,另外一个进程读的方案。为实现此目的,特用系统运行时间作为原来的计数器。 // 被监控程序喂狗时,只需要将喂狗时的系统运行时间写入到文件中即可。监控程序在监控时,如发现文件中的系统运行时间与 // “当前”系统运行时间差大于最大允许时间(dead_seconds), 判断被监控程序出问题(没有及时喂狗),监控程序将杀死被监控程序 ///////////////////////////////////////////////////////////////////////////// #include <stdio.h> #include <unistd.h> #include <sys/sysinfo.h> #define SOFT_WATCH_PATH "/var/volatile/watch" struct process_t { long up_time; long dead_seconds; int pid; char name[40]; }; //喂狗,如果超过dead_seconds秒没有喂狗,则此进程将被重启,为防止频繁操作文件, //建议增加定时器,使得调用Feed的间隔至少在5秒以上,同时要确保间隔小于最大喂狗时间, //process_name为线程名,长度不能超过39个字符 inline bool Feed(unsigned short dead_seconds, const char *process_name) { int pid = getpid(); if(pid<1) { return false; } struct sysinfo info; if ( sysinfo( &info ) != 0 ) { return false; } struct process_t process = { info.uptime, dead_seconds, pid, "" }; memset( process.name, '', sizeof( process.name ) ); strncpy( process.name, process_name, sizeof(process.name) - 1 ); char filename[sizeof(SOFT_WATCH_PATH) + 10]; sprintf(filename, "%s/%d", SOFT_WATCH_PATH, pid); int fd = open(filename, O_RDWR | O_CREAT); if( fd < 0 ) { return false; } write(fd, &process, sizeof(process_t)); close( fd ); return true; } #endif // _SOFT_DOG_HPP_
最新评论