BayesNet/tests/TestUtils.cc

#include "TestUtils.h"

using namespace std;
using namespace torch;
class Paths {
public:
    static string datasets()
    {
        return "../../data/";
    }
};

pair<vector<mdlp::labels_t>, map<string, int>> discretize(vector<mdlp::samples_t>& X, mdlp::labels_t& y, vector<string> features)
{
    vector<mdlp::labels_t> Xd;
    map<string, int> maxes;
    auto fimdlp = mdlp::CPPFImdlp();
    for (int i = 0; i < X.size(); i++) {
        fimdlp.fit(X[i], y);
        mdlp::labels_t& xd = fimdlp.transform(X[i]);
        maxes[features[i]] = *max_element(xd.begin(), xd.end()) + 1;
        Xd.push_back(xd);
    }
    return { Xd, maxes };
}

vector<mdlp::labels_t> discretizeDataset(vector<mdlp::samples_t>& X, mdlp::labels_t& y)
{
    vector<mdlp::labels_t> Xd;
    auto fimdlp = mdlp::CPPFImdlp();
    for (int i = 0; i < X.size(); i++) {
        fimdlp.fit(X[i], y);
        mdlp::labels_t& xd = fimdlp.transform(X[i]);
        Xd.push_back(xd);
    }
    return Xd;
}

bool file_exists(const string& name)
{
    if (FILE* file = fopen(name.c_str(), "r")) {
        fclose(file);
        return true;
    } else {
        return false;
    }
}

tuple<Tensor, Tensor, vector<string>, string, map<string, vector<int>>> loadDataset(const string& name, bool class_last, bool discretize_dataset)
{
    auto handler = ArffFiles();
    handler.load(Paths::datasets() + static_cast<string>(name) + ".arff", class_last);
    // Get Dataset X, y
    vector<mdlp::samples_t>& X = handler.getX();
    mdlp::labels_t& y = handler.getY();
    // Get className & Features
    auto className = handler.getClassName();
    vector<string> features;
    auto attributes = handler.getAttributes();
    transform(attributes.begin(), attributes.end(), back_inserter(features), [](const auto& pair) { return pair.first; });
    Tensor Xd;
    auto states = map<string, vector<int>>();
    if (discretize_dataset) {
        auto Xr = discretizeDataset(X, y);
        Xd = torch::zeros({ static_cast<int>(Xr.size()), static_cast<int>(Xr[0].size()) }, torch::kInt32);
        for (int i = 0; i < features.size(); ++i) {
            states[features[i]] = vector<int>(*max_element(Xr[i].begin(), Xr[i].end()) + 1);
            auto item = states.at(features[i]);
            iota(begin(item), end(item), 0);
            Xd.index_put_({ i, "..." }, torch::tensor(Xr[i], torch::kInt32));
        }
        states[className] = vector<int>(*max_element(y.begin(), y.end()) + 1);
        iota(begin(states.at(className)), end(states.at(className)), 0);
    } else {
        Xd = torch::zeros({ static_cast<int>(X.size()), static_cast<int>(X[0].size()) }, torch::kFloat32);
        for (int i = 0; i < features.size(); ++i) {
            Xd.index_put_({ i, "..." }, torch::tensor(X[i]));
        }
    }
    return { Xd, torch::tensor(y, torch::kInt32), features, className, states };
}

tuple<vector<vector<int>>, vector<int>, vector<string>, string, map<string, vector<int>>> loadFile(const string& name)
{
    auto handler = ArffFiles();
    handler.load(Paths::datasets() + static_cast<string>(name) + ".arff");
    // Get Dataset X, y
    vector<mdlp::samples_t>& X = handler.getX();
    mdlp::labels_t& y = handler.getY();
    // Get className & Features
    auto className = handler.getClassName();
    vector<string> features;
    auto attributes = handler.getAttributes();
    transform(attributes.begin(), attributes.end(), back_inserter(features), [](const auto& pair) { return pair.first; });
    // Discretize Dataset
    vector<mdlp::labels_t> Xd;
    map<string, int> maxes;
    tie(Xd, maxes) = discretize(X, y, features);
    maxes[className] = *max_element(y.begin(), y.end()) + 1;
    map<string, vector<int>> states;
    for (auto feature : features) {
        states[feature] = vector<int>(maxes[feature]);
    }
    states[className] = vector<int>(maxes[className]);
    return { Xd, y, features, className, states };
}
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`#include "TestUtils.h"`

			`using namespace std;`
			`using namespace torch;`
			`class Paths {`
			`public:`
			`static string datasets()`
			`{`
Add First BayesMetrics Tests 2023-10-04 23:14:16 +00:00			`return "../../data/";`
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`}`
			`};`

			`pair<vector<mdlp::labels_t>, map<string, int>> discretize(vector<mdlp::samples_t>& X, mdlp::labels_t& y, vector<string> features)`
			`{`
			`vector<mdlp::labels_t> Xd;`
			`map<string, int> maxes;`
			`auto fimdlp = mdlp::CPPFImdlp();`
			`for (int i = 0; i < X.size(); i++) {`
			`fimdlp.fit(X[i], y);`
			`mdlp::labels_t& xd = fimdlp.transform(X[i]);`
			`maxes[features[i]] = *max_element(xd.begin(), xd.end()) + 1;`
			`Xd.push_back(xd);`
			`}`
			`return { Xd, maxes };`
			`}`

			`vector<mdlp::labels_t> discretizeDataset(vector<mdlp::samples_t>& X, mdlp::labels_t& y)`
			`{`
			`vector<mdlp::labels_t> Xd;`
			`auto fimdlp = mdlp::CPPFImdlp();`
			`for (int i = 0; i < X.size(); i++) {`
			`fimdlp.fit(X[i], y);`
			`mdlp::labels_t& xd = fimdlp.transform(X[i]);`
			`Xd.push_back(xd);`
			`}`
			`return Xd;`
			`}`

			`bool file_exists(const string& name)`
			`{`
			`if (FILE* file = fopen(name.c_str(), "r")) {`
			`fclose(file);`
			`return true;`
			`} else {`
			`return false;`
			`}`
			`}`

			`tuple<Tensor, Tensor, vector<string>, string, map<string, vector<int>>> loadDataset(const string& name, bool class_last, bool discretize_dataset)`
			`{`
			`auto handler = ArffFiles();`
			`handler.load(Paths::datasets() + static_cast<string>(name) + ".arff", class_last);`
			`// Get Dataset X, y`
			`vector<mdlp::samples_t>& X = handler.getX();`
			`mdlp::labels_t& y = handler.getY();`
			`// Get className & Features`
			`auto className = handler.getClassName();`
			`vector<string> features;`
			`auto attributes = handler.getAttributes();`
			`transform(attributes.begin(), attributes.end(), back_inserter(features), [](const auto& pair) { return pair.first; });`
			`Tensor Xd;`
			`auto states = map<string, vector<int>>();`
			`if (discretize_dataset) {`
			`auto Xr = discretizeDataset(X, y);`
Add First BayesMetrics Tests 2023-10-04 23:14:16 +00:00			`Xd = torch::zeros({ static_cast<int>(Xr.size()), static_cast<int>(Xr[0].size()) }, torch::kInt32);`
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`for (int i = 0; i < features.size(); ++i) {`
			`states[features[i]] = vector<int>(*max_element(Xr[i].begin(), Xr[i].end()) + 1);`
			`auto item = states.at(features[i]);`
			`iota(begin(item), end(item), 0);`
Add First BayesMetrics Tests 2023-10-04 23:14:16 +00:00			`Xd.index_put_({ i, "..." }, torch::tensor(Xr[i], torch::kInt32));`
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`}`
			`states[className] = vector<int>(*max_element(y.begin(), y.end()) + 1);`
			`iota(begin(states.at(className)), end(states.at(className)), 0);`
			`} else {`
Add First BayesMetrics Tests 2023-10-04 23:14:16 +00:00			`Xd = torch::zeros({ static_cast<int>(X.size()), static_cast<int>(X[0].size()) }, torch::kFloat32);`
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`for (int i = 0; i < features.size(); ++i) {`
Add First BayesMetrics Tests 2023-10-04 23:14:16 +00:00			`Xd.index_put_({ i, "..." }, torch::tensor(X[i]));`
Refactor Tests and add BayesMetrics test 2023-10-04 21:19:23 +00:00			`}`
			`}`
			`return { Xd, torch::tensor(y, torch::kInt32), features, className, states };`
			`}`

			`tuple<vector<vector<int>>, vector<int>, vector<string>, string, map<string, vector<int>>> loadFile(const string& name)`
			`{`
			`auto handler = ArffFiles();`
			`handler.load(Paths::datasets() + static_cast<string>(name) + ".arff");`
			`// Get Dataset X, y`
			`vector<mdlp::samples_t>& X = handler.getX();`
			`mdlp::labels_t& y = handler.getY();`
			`// Get className & Features`
			`auto className = handler.getClassName();`
			`vector<string> features;`
			`auto attributes = handler.getAttributes();`
			`transform(attributes.begin(), attributes.end(), back_inserter(features), [](const auto& pair) { return pair.first; });`
			`// Discretize Dataset`
			`vector<mdlp::labels_t> Xd;`
			`map<string, int> maxes;`
			`tie(Xd, maxes) = discretize(X, y, features);`
			`maxes[className] = *max_element(y.begin(), y.end()) + 1;`
			`map<string, vector<int>> states;`
			`for (auto feature : features) {`
			`states[feature] = vector<int>(maxes[feature]);`
			`}`
			`states[className] = vector<int>(maxes[className]);`
			`return { Xd, y, features, className, states };`
			`}`