<p>I created a simple test branch to try and reproduce <a href="https://github.com/zoq" class="user-mention">@zoq</a>'s results: rcurtin:tracedot.  I tested with master, which is just tracedot1, and the tracedot branch, which is tracedot2 (<code>accu(a % b)</code>).  Tested on a couple of systems, I got the following results for <code>time bin/mlpack_test -t LRSDPTest</code>.</p>

<pre><code>zax.ratml.org, with gcc:
tracedot1     38.071s   38.066s   38.142s
tracedot2     20.614s   20.558s   20.609s

zax.ratml.org, with clang:
tracedot1     40.032s   40.011s   40.052s
tracedot2     21.320s   21.913s   21.704s

beautiful.cc.gt.atl.ga.us, with gcc (Intel i5 650, 5GB RAM):
tracedot1     65.709s   67.128s   66.380s
tracedot2     38.891s   38.940s   39.306s

collar.cc.gt.atl.ga.us (AMD Athlon 64 X2 3800+):
tracedot1     159.355s  158.522s  158.692s
tracedot2     115.019s  114.943s  114.949s
</code></pre>

<p>I didn't bother with the ARM test, and the sparc64 system is still compiling mlpack, so I figured these were good enough results.  My concern is that Marcus is seeing slower results as a result of being on OS X, but I don't have an OS X box to test with.  Marcus, would you mind trying the rcurtin:tracedot branch on the same system you got benchmarks from earlier?</p>

<p style="font-size:small;-webkit-text-size-adjust:none;color:#666;">&mdash;<br>Reply to this email directly or <a href="https://github.com/mlpack/mlpack/pull/2#issuecomment-70039384">view it on GitHub</a>.<img alt="" height="1" src="https://github.com/notifications/beacon/AJ4bFA5GuTqKD_2_W7SXkYbUCf7aoxF-ks5nhz2bgaJpZM4DK2qy.gif" width="1" /></p>
<div itemscope itemtype="http://schema.org/EmailMessage">
  <div itemprop="action" itemscope itemtype="http://schema.org/ViewAction">
    <link itemprop="url" href="https://github.com/mlpack/mlpack/pull/2#issuecomment-70039384"></link>
    <meta itemprop="name" content="View Pull Request"></meta>
  </div>
  <meta itemprop="description" content="View this Pull Request on GitHub"></meta>
</div>