<p>Hi, keon, what is your codes?Do you do the transform?I think your codes looks like</p>

<pre><code>BOOST_AUTO_TEST_CASE(loadFile)
{
    using namespace mlpack;
    using namespace mlpack::data;
    using namespace std;

    fstream f;
    f.open("test.csv", fstream::out);
    //f &lt;&lt; "3, a, 2, a" &lt;&lt; endl;
    //f &lt;&lt; "5, 6, 0, 6" &lt;&lt; endl;
    //f &lt;&lt; "9, 8, 4, 8" &lt;&lt; endl;
    f &lt;&lt; "3, 0, a, 0" &lt;&lt; endl;
    f &lt;&lt; "5, 6, 0, 6" &lt;&lt; endl;
    f &lt;&lt; "9, 8, 4, 8" &lt;&lt; endl;
    f.close();

    arma::mat dataIn;
    data::DatasetInfo info;
    bool const transpose = false;
    data::Load("test.csv", dataIn, info,  true, transpose);
    std::cout&lt;&lt;dataIn&lt;&lt;std::endl;

    Log::Info &lt;&lt; "dataset info: " &lt;&lt; endl;    
    for (size_t i = 0; i &lt; data.n_rows; ++i)
    {
        std::cout &lt;&lt; info.NumMappings(i) &lt;&lt; " mappings in dimension "
                  &lt;&lt; i &lt;&lt; "." &lt;&lt; endl;
    }//*/

    remove("test.csv");
}

</code></pre>

<p>I get the same results as yours, and I think it is expected results.</p>

<pre><code>3.0, a, 2.0, a
5.0, 6.0, 0.0, 6.0
9.0, 8.0, 4.0, 8.0

is translated to:
[INFO ]    3.0000   5.0000   9.0000
[INFO ]         0   1.0000   2.0000 &lt;-- should be 0, 1, 2, not 0, 6, 8
[INFO ]    2.0000        0   4.0000
[INFO ]         0   1.0000   2.0000 &lt;-- should be 0, 1, 2, not 0, 6, 8
</code></pre>

<p>Why they should be 0, 1, 2? Because after transform, every column is a dimension, if we find out every column exist any element do not belongs to numeric, we should treat all of the element as categorical. If not, how could we differentiate data as following?</p>

<pre><code>3.0, a, 2.0,a
5.0, 0, 1.0, 0
</code></pre>

<p>First we map a to 0, 0 back to 0?This do not make sense, the easiest yet reasonable solution is treat the whole column as categorical data.</p>

<p style="font-size:small;-webkit-text-size-adjust:none;color:#666;">&mdash;<br />You are receiving this because you are subscribed to this thread.<br />Reply to this email directly, <a href="https://github.com/mlpack/mlpack/pull/694#issuecomment-229198175">view it on GitHub</a>, or <a href="https://github.com/notifications/unsubscribe/AJ4bFL-DcpAsOdmz9yZINYtFDBBoRXLPks5qQZojgaJpZM4I07W-">mute the thread</a>.<img alt="" height="1" src="https://github.com/notifications/beacon/AJ4bFJpPtkxJkXjIsZEWUClkQ2CbPkjDks5qQZojgaJpZM4I07W-.gif" width="1" /></p>
<div itemscope itemtype="http://schema.org/EmailMessage">
<div itemprop="action" itemscope itemtype="http://schema.org/ViewAction">
  <link itemprop="url" href="https://github.com/mlpack/mlpack/pull/694#issuecomment-229198175"></link>
  <meta itemprop="name" content="View Pull Request"></meta>
</div>
<meta itemprop="description" content="View this Pull Request on GitHub"></meta>
</div>