<div>Iīm testing Nagios NRPE and Iīm finding serveral problems.</div>
<div> </div>
<div>Iīm working with:</div>
<div>- Nagios 2.9 on Solaris 9 (last CVS patch).</div>
<div>- NRPE 2.8.1 on Solaris 8 (last CVS patch).</div>
<div>- gcc 3.4.6</div>
<p>1) When I try to start a daemon using NRPE, I receive the message "CHECK_NRPE: Socket timeout after 10 seconds.", although the service is started.</p>
<p>> check_nrpe -H <remote_machine> -n -p 5666 -c start_daemon<br>CHECK_NRPE: Socket timeout after 10 seconds.</p>
<p>In the remote machine I have in the nrpe.cfg:</p>
<p>command[start_daemon]=/usr/local/bin/sudo /usr/local/nagios/bin/teste_daemon</p>
<p>My teste_daemon is:<br>----------------------------------------<br>#!/usr/bin/perl</p>
<p>use POSIX;</p>
<p>chroot("/usr/local/nagios/bin")<br>    or die "Couldn't chroot: $!";</p>
<p>$pid = fork;<br>if ($pid) {<br>    print "OK\n";<br>    exit 0;<br>}<br>die "Couldn't fork: $!" unless defined($pid);</p>
<p>POSIX::setsid() or die "Can't start a new session: $!";</p>
<p>while (1) {</p>
<p>    sleep 10;</p>
<p>}</p>
<p>exit 0;</p>
<p>-------------------------------------------</p>
<p>It seems that the NRPE waits an output message from the teste_daemon that does not come (?!).</p>
<p>2) When I try to check a process using the plugin "check_procs" via NRPE the number of process running is added by one.</p>
<p>Example:</p>
<p>> check_nrpe -H <remote_machine> -n -p 5666 -c check_daemon<br>PROCS CRITICAL: 2 processes with args 'teste_daemon'</p>
<p>In the nrpe.cfg, I have:</p>
<p>command[check_daemon]=/usr/local/nagios/libexec/check_procs -c 1:1 -a teste_daemon</p>
<p>But, when I run "check_procs -c 1:1 -a teste_daemon" on the remote machine, I have:</p>
<p>PROCS OK: 1 process with args 'teste_daemon'</p>
<p>The "solution" was to change the command to "check_procs -c 1:1 -p 1 -a teste_daemon", <br>but it isnīt what Iīm looking for.</p>
<p>3) I couldnīt configure NRPE to run with the inetd. It always answers with a SSL error message, even with <br>the "-n" flag in both side.</p>
<p>So I found several problems with NRPE that are difficulting my job. I was intending to put Nagios to<br>monitoring more than 3500 machines but after this problems I donīt know if other people of my group<br>will feel comfortable to use this tool. Thats is a pity, because I found Nagios a excellent monitoring tool,
<br>very flexible, but I donīt know if other people will buy the fight to change our actual tool to Nagios.</p>