<div>More tests... <br></div>
<div>I ran tcpdump on both relay-01 and the archive box.  There were zero descrepancies between the tcpdumps.  This tells me that the &quot;virtual network&quot; is good.</div>
<div> </div>
<div>Here is the latest in message descrepancy:</div>
<div>relay-01 - 3745 mps (this is according to the processed destination, my archive box)</div>
<div>archive - 1900 mps (this is according to the processed source)</div>
<div> </div>
<div>Another question about syslog processing, does syslog-ng record processed stats for the source based on what it wrote to the file destinations? Or, is it simply on how many messages it receives on the source? If it&#39;s simply how many messages it&#39;s received then all my filters and destinations can be ruled out.  I was concerned that having 150 filters and 150 destinations within the syslog_config might hit a limitation.  What I&#39;ve done is separated out every network device to a seperate file to make searches and our web front end(phplogcon) perform better.</div>

<div> </div>
<div> </div>
<div class="gmail_quote">On Wed, Jun 17, 2009 at 10:24 AM, Aaron Robel <span dir="ltr">&lt;<a href="mailto:megawott@gmail.com" target="_blank">megawott@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<div>So, I did a couple tests.</div>
<div> </div>
<div>I started by watching realtime logs flow in on both the relay and archive.  This showed that sure enough we not getting all our messages to the back end.</div>
<div> </div>
<div>I then removed the following options:</div>
<div>
<div>time_sleep(10);<br>log_fetch_limit(250);<br>log_fifo_size(2000);<br></div>
<div>flush_lines(2000);<br>flush_timeout(200);</div></div>
<div> </div>
<div>Then performed the test again.  The results were much  better, but we are still missing about 1 out of every 6 or 8 messages.  CPU, as expected, has also dramatically increased from 10% to 60% utilization.</div>
<div> </div>
<div>I thought my next step would be to compare tcpdumps on both boxes to rule out the network, then to progress onto more dramatic options.  Any other ideas on what may be happening is greatly appreciated. </div>
<div> </div>
<div>Just when I thought this project was about to be wrapped up, it drags me back in...<br></div>
<div>
<div></div>
<div>
<div class="gmail_quote">On Wed, Jun 17, 2009 at 10:05 AM, Martin Holste <span dir="ltr">&lt;<a href="mailto:mcholste@gmail.com" target="_blank">mcholste@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">I highly doubt that the UDP is being dropped on the &quot;network&quot; (quoted since it&#39;s all in a VM), but you can always check by running iptraf on the receiving interfaces to get a ballpark figure of how many UDP packets are coming in on 514.  To find out if Syslog-NG is the bottleneck, try a test config that is as simple as possible, e.g. configure with just one source and one file destination and see what the stats do then.  If possible, you could also try sending all of the logs to a stock syslogd daemon (see a previous thread about this) which is faster for simple file writing operations.  The truth may be that a VM is not a good environment for high-performance log collection, and that turning all those VM&#39;s into one physical might outperform your VM cluster.  Please keep me posted--I&#39;m interested in how this plays out.<br>
<font color="#888888"><br>--Martin</font> 
<div>
<div></div>
<div><br><br>
<div class="gmail_quote">On Wed, Jun 17, 2009 at 11:26 AM, Aaron Robel <span dir="ltr">&lt;<a href="mailto:megawott@gmail.com" target="_blank">megawott@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0pt 0pt 0pt 0.8ex; BORDER-LEFT: rgb(204,204,204) 1px solid">
<div>You make a good point. I initially thought the same thing and did some checking on the bandwidth usage and we aren&#39;t saturating any of the links or even getting close.  I also didn&#39;t see any errors or drops on the interfaces.  The big question for me is how does this all play out in the virtualized environment could I be running into a limitation there, rhetorical question.  All of these hosts live physically on the same piece of hardware and on the same vlan.   I&#39;ll keep poking around in that arena to see if anything turns up. Maybe play with tcp to the archive host, I just worry about performance implications.</div>

<div> </div>
<div>Do you see anything else in my options config that looks amiss?</div>
<div> </div>
<div>Thanks for the suggestion Joe.<br></div>
<div>Hardware stats:</div>
<div>relays:</div>
<div>2 3gig procs</div>
<div>4 gig mem</div>
<div>1 TB disk</div>
<div> </div>
<div>archive</div>
<div>4 3 gig procs</div>
<div>6 gig mem</div>
<div>5.5 TB disk</div>
<div> </div>
<div>Network bandwidth stats:</div>
<div>relay 01:  in-850KBps out-300KBps (I&#39;m assuming the descrepancy here is due to the fifo and flush settings.)</div>
<div>relay 02:  in-60KBps out-55KBps</div>
<div>relay 03:  in-nill out-nill</div>
<div> </div>
<div>Archive:</div>
<div>network utilization: 600KBps<br></div>
<div class="gmail_quote">
<div>
<div></div>
<div>On Wed, Jun 17, 2009 at 8:58 AM, Fegan, Joe <span dir="ltr">&lt;<a href="mailto:Joe.Fegan@hp.com" target="_blank">Joe.Fegan@hp.com</a>&gt;</span> wrote:<br></div></div>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: rgb(204,204,204) 1px solid">
<div>
<div></div>
<div>
<div>
<div dir="ltr" align="left"><span><font face="Arial" color="#0000ff" size="2">Knee jerk reaction: are you using udp? You probably know that udp is a connection-less, fire-and-forget protocol so if the packet gets lost neither the sender nor the intended recipent will know (or care).</font></span></div>
<br>
<div lang="en-us" dir="ltr" align="left">
<hr>
<font face="Tahoma" size="2"><b>From:</b> <a href="mailto:syslog-ng-bounces@lists.balabit.hu" target="_blank">syslog-ng-bounces@lists.balabit.hu</a> [mailto:<a href="mailto:syslog-ng-bounces@lists.balabit.hu" target="_blank">syslog-ng-bounces@lists.balabit.hu</a>] <b>On Behalf Of </b>Aaron Robel<br>
<b>Sent:</b> 17 June 2009 16:20<br><b>To:</b> <a href="mailto:syslog-ng@lists.balabit.hu" target="_blank">syslog-ng@lists.balabit.hu</a><br><b>Subject:</b> [syslog-ng] Syslog-ng 3.0.2 statistics<br></font><br></div>
<div>
<div></div>
<div>
<div></div>
<div>Hello,</div>
<div> </div>
<div>My apologies in advance, this is my first posting and I&#39;m quite the rook&#39; when it comes to Linux and Syslog-ng. I keep wondering why this is my project.</div>
<div> </div>
<div>I have a 4 server syslog deployment with 3 front end &quot;relay&quot; boxes and 1 backend archive box all within a virtualized SLES environment.</div>
<div> </div>
<div>Recently I noticed that the relay&#39;s together are averaging about 2500 messages per second (mps).   The majority of the messages are coming from a single relay, about 2000 mps. Yet the archive box is only averaging about 400 mps.</div>

<div> </div>
<div>Since we are running 3.0.2 I decided to turn up the stats_level to (1).  I don&#39;t see any drops to the about 150 file destinations that I&#39;ve built.</div>
<div> </div>
<div>What does stamp, processed, stored, etc.. mean?  I couldn&#39;t find any detailed documentation about the different statistics. </div>
<div> </div>
<div>Why am I getting such a large discrepency between &quot;stamp&quot; and &quot;processed&quot; in the log stats?</div>
<div> </div>
<div>Finally, since I&#39;m sending the email does anyone see an issue with the way I&#39;ve got the flow control set up in the global options?</div>
<div> </div>
<div>Here are my stats in question off my archive box:</div>
<div>processed=&#39;src.udp(s_network#0)=22020892&#39;, <br>stamp=&#39;src.udp(s_network#0)=1245249328&#39;</div>
<div> </div>
<div>Here&#39;s the global&#39;s off the archive box:</div>
<div>options {<br>        time_sleep(10);<br>        log_fetch_limit(250);<br>        log_fifo_size(2000);<br>        use_dns(no);<br>        keep_timestamp(yes);<br>        dns_cache(no);<br>        long_hostnames(off);<br>
        flush_lines(2000);<br>        flush_timeout(200);<br>        perm(0644);<br>        stats_freq(1800);<br>        stats_level(1);<br>        time_reopen(10);<br>        create_dirs(yes);<br>        dir_perm(755);<br>
};<br clear="all"></div>
<div></div>
<div>Thanks!</div>
<div> </div></div></div></div><br></div></div>______________________________________________________________________________<br>Member info: <a href="https://lists.balabit.hu/mailman/listinfo/syslog-ng" target="_blank">https://lists.balabit.hu/mailman/listinfo/syslog-ng</a><br>
Documentation: <a href="http://www.balabit.com/support/documentation/?product=syslog-ng" target="_blank">http://www.balabit.com/support/documentation/?product=syslog-ng</a><br>FAQ: <a href="http://www.campin.net/syslog-ng/faq.html" target="_blank">http://www.campin.net/syslog-ng/faq.html</a><br>
<br><br></blockquote></div><br><br clear="all">
<div></div><br>-- <br><font color="#888888">Aaron Robel<br></font><br>______________________________________________________________________________<br>Member info: <a href="https://lists.balabit.hu/mailman/listinfo/syslog-ng" target="_blank">https://lists.balabit.hu/mailman/listinfo/syslog-ng</a><br>
Documentation: <a href="http://www.balabit.com/support/documentation/?product=syslog-ng" target="_blank">http://www.balabit.com/support/documentation/?product=syslog-ng</a><br>FAQ: <a href="http://www.campin.net/syslog-ng/faq.html" target="_blank">http://www.campin.net/syslog-ng/faq.html</a><br>
<br><br></blockquote></div><br></div></div><br>______________________________________________________________________________<br>Member info: <a href="https://lists.balabit.hu/mailman/listinfo/syslog-ng" target="_blank">https://lists.balabit.hu/mailman/listinfo/syslog-ng</a><br>
Documentation: <a href="http://www.balabit.com/support/documentation/?product=syslog-ng" target="_blank">http://www.balabit.com/support/documentation/?product=syslog-ng</a><br>FAQ: <a href="http://www.campin.net/syslog-ng/faq.html" target="_blank">http://www.campin.net/syslog-ng/faq.html</a><br>
<br><br></blockquote></div><br><br clear="all">
<div></div><br>-- <br>Aaron Robel<br></div></div></blockquote></div><br><br clear="all">
<div></div><br>-- <br>Aaron Robel<br>