<table cellspacing="0" cellpadding="0" border="0" ><tr><td valign="top" style="font: inherit;">I see,<br><br>I will resend the trace once I catch it locked up.<br><br>Thanks for your help,<br><br>-igor<br><br>--- On <b>Tue, 11/3/09, Balazs Scheidler <i>&lt;bazsi@balabit.hu&gt;</i></b> wrote:<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"><br>From: Balazs Scheidler &lt;bazsi@balabit.hu&gt;<br>Subject: Re: [syslog-ng] syslog-ng on solaris locks up after a while<br>To: imanassypov@rogers.com, "Syslog-ng users' and developers' mailing list" &lt;syslog-ng@lists.balabit.hu&gt;<br>Cc: "Pallagi Zoltán" &lt;pzolee@balabit.hu&gt;, network@ci.com<br>Received: Tuesday, November 3, 2009, 2:11 PM<br><br><div class="plainMail">Hi,<br><br>The problem is that you killed the supervisor process, which restarts<br>syslog-ng in case it crashes. However the hang is not in this part, but<br>in its child.<br><br>So by
 looking at the ps output, I'd say that in this situation you<br>should have trussed 13621 and not its parent.<br><br>On Tue, 2009-11-03 at 08:54 -0800, Igor Manassypov wrote:<br>&gt; Hi Zoltan,<br>&gt; <br>&gt; <br>&gt; Here are the traces:<br>&gt; <br>&gt; bash-3.00# ps -eaf | grep syslog<br>&gt;&nbsp; &nbsp;&nbsp;&nbsp;root 12694 12616&nbsp;&nbsp;&nbsp;0 11:37:07 pts/1&nbsp; &nbsp; &nbsp;&nbsp;&nbsp;0:00 grep syslog<br>&gt;&nbsp; &nbsp;&nbsp;&nbsp;root 13012&nbsp; &nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;Oct 21 ?&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;0:00 syslog-ng -v<br>&gt;&nbsp; &nbsp;&nbsp;&nbsp;root 13013 13012&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;Oct 21 ?&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;0:41 syslog-ng -v<br>&gt;&nbsp; &nbsp;&nbsp;&nbsp;root 13620&nbsp; &nbsp;&nbsp;&nbsp;1&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;Oct 08 ?<br>&gt; 0:00 /usr/local/sbin/syslog-ng<br>&gt;&nbsp; &nbsp;&nbsp;&nbsp;root 13621
 13620&nbsp;&nbsp;&nbsp;0&nbsp;&nbsp;&nbsp;Oct 08 ?<br>&gt; 6:16 /usr/local/sbin/syslog-ng<br>&gt; bash-3.00# truss -f -p "13620"<br>&gt; 13620:&nbsp; waitid(P_PID, 13621, 0xFFBFF468, WEXITED|WTRAPPED)<br>&gt; (sleeping...)<br>&gt; <br>&gt; 13620:&nbsp; &nbsp; &nbsp; Received signal #11, SIGSEGV, in waitid() [default]<br>&gt; 13620:&nbsp; &nbsp; &nbsp; &nbsp; siginfo: SIGSEGV pid=12717 uid=0<br>&gt; 13620:&nbsp; waitid(P_PID, 13621, 0xFFBFF468, WEXITED|WTRAPPED) Err#4 EINTR<br>&gt; <br>&gt; Core was generated by `/usr/local/sbin/syslog-ng'.<br>&gt; Program terminated with signal 11, Segmentation fault.<br>&gt; [New process 79156&nbsp; &nbsp; ]<br>&gt; #0&nbsp; 0xfed4ad80 in _waitid () from /lib/libc.so.1<br>&gt; (gdb) bt full<br>&gt; #0&nbsp; 0xfed4ad80 in _waitid () from /lib/libc.so.1<br>&gt; No symbol table info available.<br>&gt; #1&nbsp; 0xfecee038 in _waitpid () from /lib/libc.so.1<br>&gt; No symbol table info available.<br>&gt; #2&nbsp; 0xfed3a70c
 in waitpid () from /lib/libc.so.1<br>&gt; No symbol table info available.<br>&gt; #3&nbsp; 0x0003017c in g_process_start () at gprocess.c:1042<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;rc = 0<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;deadlock = 0<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;pid = 13621<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;__PRETTY_FUNCTION__ = "g_process_start"<br>&gt; #4&nbsp; 0x0001c214 in main (argc=1, argv=0xffbffd14) at main.c:371<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;cfg = (GlobalConfig *) 0x10034<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;rc = 310272<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;ctx = (GOptionContext *) 0x76030<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;error = (GError *) 0x0<br>&gt; <br>&gt; Please let me know if I can provide you with more information,<br>&gt; <br>&gt; Thanks!<br>&gt; <br>&gt; --- On Tue, 11/3/09, Pallagi Zoltán &lt;<a ymailto="mailto:pzolee@balabit.hu"
 href="/mc/compose?to=pzolee@balabit.hu">pzolee@balabit.hu</a>&gt; wrote:<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;From: Pallagi Zoltán &lt;<a ymailto="mailto:pzolee@balabit.hu" href="/mc/compose?to=pzolee@balabit.hu">pzolee@balabit.hu</a>&gt;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;Subject: Re: [syslog-ng] syslog-ng on solaris locks up after a<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;while<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;To: <a ymailto="mailto:imanassypov@rogers.com" href="/mc/compose?to=imanassypov@rogers.com">imanassypov@rogers.com</a>, "Syslog-ng users' and developers'<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;mailing list" &lt;<a ymailto="mailto:syslog-ng@lists.balabit.hu" href="/mc/compose?to=syslog-ng@lists.balabit.hu">syslog-ng@lists.balabit.hu</a>&gt;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;Received: Tuesday, November 3, 2009, 11:10 AM<br>&gt;&nbsp; &nbsp;
 &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;Hi Igor,<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;Can you show me truss output or backtrace of the stuck<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;syslog-ng?:<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;truss:<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;truss -f -p "syslog-ng pid"<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;backtrace:<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;kill -11 "syslog-ng pid" (syslog-ng will drop a core file)<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;gdb syslog-ng core<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;bt full<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;Igor Manassypov írta: <br>&gt;&nbsp;
 &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Hello,<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; I am having an issue with a solaris installation of the<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; syslog-ng. It is configured such that all the logs are<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; stored different per-ip folders. This is my centralized<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; logging device, so it is fairly heavily loaded with<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; receiving logs from a few dozen hosts. The syslog-ng process<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; locks up every two to three weeks, with no messages logging<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; to any of the files. The only way of getting it back is kill<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; -9 the
 process and restart it.<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Is there any known issue of same sorts and is there any<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; other way around it other than recycling the daemon every<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; night?<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; here is the version info:<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; bash-3.00# syslog-ng --version<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; syslog-ng 3.0.4<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Revision: ssh<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; +git://<a ymailto="mailto:bazsi@git.balabit"
 href="/mc/compose?to=bazsi@git.balabit">bazsi@git.balabit</a>//var/scm/git/syslog-ng/syslog-ng-ose--mainline--3.0#master#1b5d618e301ad94aa20e692ffba16469dece8d10<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Compile-Date: Aug 11 2009 10:44:17<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Threads: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Debug: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-GProf: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Memtrace: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Sun-STREAMS: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Sun-Door: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-IPv6: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Spoof-Source: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-TCP-Wrapper: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-SSL:
 on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-SQL: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Linux-Caps: off<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Enable-Pcre: on<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; bash-3.00# uname -a<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; SunOS prelude 5.10 Generic_137137-09 sun4v sparc SUNW,T5240<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Thanks!<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; -igor<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Igor Manassypov., M.Eng, P.Eng, CCIE 23032, CCVP Network<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Architect<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt;
 ____________________________________________________________<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; ______________________________________________________________________________<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Member info: <a href="https://lists.balabit.hu/mailman/listinfo/syslog-ng" target="_blank">https://lists.balabit.hu/mailman/listinfo/syslog-ng</a><br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; Documentation: <a href="http://www.balabit.com/support/documentation/?product=syslog-ng" target="_blank">http://www.balabit.com/support/documentation/?product=syslog-ng</a><br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; FAQ: <a href="http://www.campin.net/syslog-ng/faq.html" target="_blank">http://www.campin.net/syslog-ng/faq.html</a><br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt; <br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;&gt;&nbsp;&nbsp;&nbsp;<br>&gt;&nbsp;
 &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt;&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;&nbsp;<br>&gt; ______________________________________________________________________________<br>&gt; Member info: <a href="https://lists.balabit.hu/mailman/listinfo/syslog-ng" target="_blank">https://lists.balabit.hu/mailman/listinfo/syslog-ng</a><br>&gt; Documentation: <a href="http://www.balabit.com/support/documentation/?product=syslog-ng" target="_blank">http://www.balabit.com/support/documentation/?product=syslog-ng</a><br>&gt; FAQ: <a href="http://www.campin.net/syslog-ng/faq.html" target="_blank">http://www.campin.net/syslog-ng/faq.html</a><br>&gt; <br>-- <br>Bazsi<br><br><br></div></blockquote></td></tr></table>