Set smoothing as fit parameter

2024-06-11 11:40:45 +02:00
parent 27a3e5a5e0
commit b34869cc61
30 changed files with 168 additions and 178 deletions
--- a/tests/TestA2DE.cc
+++ b/tests/TestA2DE.cc
@@ -16,7 +16,7 @@ TEST_CASE("Fit and Score", "[A2DE]")
 {
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::A2DE();
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.score(raw.Xv, raw.yv) == Catch::Approx(0.831776).epsilon(raw.epsilon));
    REQUIRE(clf.getNumberOfNodes() == 360);
    REQUIRE(clf.getNumberOfEdges() == 756);
@@ -30,18 +30,18 @@ TEST_CASE("Test score with predict_voting", "[A2DE]")
       {"predict_voting", true},
    };
    clf.setHyperparameters(hyperparameters);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.score(raw.Xv, raw.yv) == Catch::Approx(0.82243).epsilon(raw.epsilon));
    hyperparameters["predict_voting"] = false;
    clf.setHyperparameters(hyperparameters);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.score(raw.Xv, raw.yv) == Catch::Approx(0.83178).epsilon(raw.epsilon));
 }
 TEST_CASE("Test graph", "[A2DE]")
 {
    auto raw = RawDatasets("iris", true);
    auto clf = bayesnet::A2DE();
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto graph = clf.graph();
    REQUIRE(graph.size() == 78);
    REQUIRE(graph[0] == "digraph BayesNet {\nlabel=<BayesNet A2DE_0>\nfontsize=30\nfontcolor=blue\nlabelloc=t\nlayout=circo\n");
--- a/tests/TestBayesClassifier.cc
+++ b/tests/TestBayesClassifier.cc
@@ -18,38 +18,38 @@ TEST_CASE("Test Cannot build dataset with wrong data vector", "[Classifier]")
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
    raw.yv.pop_back();
-    REQUIRE_THROWS_AS(model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states), std::runtime_error);
-    REQUIRE_THROWS_WITH(model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states), "* Error in X and y dimensions *\nX dimensions: [4, 150]\ny dimensions: [149]");
+    REQUIRE_THROWS_AS(model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing), std::runtime_error);
+    REQUIRE_THROWS_WITH(model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing), "* Error in X and y dimensions *\nX dimensions: [4, 150]\ny dimensions: [149]");
 }
 TEST_CASE("Test Cannot build dataset with wrong data tensor", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
    auto yshort = torch::zeros({ 149 }, torch::kInt32);
-    REQUIRE_THROWS_AS(model.fit(raw.Xt, yshort, raw.features, raw.className, raw.states), std::runtime_error);
-    REQUIRE_THROWS_WITH(model.fit(raw.Xt, yshort, raw.features, raw.className, raw.states), "* Error in X and y dimensions *\nX dimensions: [4, 150]\ny dimensions: [149]");
+    REQUIRE_THROWS_AS(model.fit(raw.Xt, yshort, raw.features, raw.className, raw.states, raw.smoothing), std::runtime_error);
+    REQUIRE_THROWS_WITH(model.fit(raw.Xt, yshort, raw.features, raw.className, raw.states, raw.smoothing), "* Error in X and y dimensions *\nX dimensions: [4, 150]\ny dimensions: [149]");
 }
 TEST_CASE("Invalid data type", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", false);
-    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states), std::invalid_argument);
-    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states), "dataset (X, y) must be of type Integer");
+    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing), std::invalid_argument);
+    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing), "dataset (X, y) must be of type Integer");
 }
 TEST_CASE("Invalid number of features", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
    auto Xt = torch::cat({ raw.Xt, torch::zeros({ 1, 150 }, torch::kInt32) }, 0);
-    REQUIRE_THROWS_AS(model.fit(Xt, raw.yt, raw.features, raw.className, raw.states), std::invalid_argument);
-    REQUIRE_THROWS_WITH(model.fit(Xt, raw.yt, raw.features, raw.className, raw.states), "Classifier: X 5 and features 4 must have the same number of features");
+    REQUIRE_THROWS_AS(model.fit(Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing), std::invalid_argument);
+    REQUIRE_THROWS_WITH(model.fit(Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing), "Classifier: X 5 and features 4 must have the same number of features");
 }
 TEST_CASE("Invalid class name", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
-    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, "duck", raw.states), std::invalid_argument);
-    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, "duck", raw.states), "class name not found in states");
+    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, "duck", raw.states, raw.smoothing), std::invalid_argument);
+    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, "duck", raw.states, raw.smoothing), "class name not found in states");
 }
 TEST_CASE("Invalid feature name", "[Classifier]")
 {
@@ -57,8 +57,8 @@ TEST_CASE("Invalid feature name", "[Classifier]")
    auto raw = RawDatasets("iris", true);
    auto statest = raw.states;
    statest.erase("petallength");
-    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, raw.className, statest), std::invalid_argument);
-    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, raw.className, statest), "feature [petallength] not found in states");
+    REQUIRE_THROWS_AS(model.fit(raw.Xt, raw.yt, raw.features, raw.className, statest, raw.smoothing), std::invalid_argument);
+    REQUIRE_THROWS_WITH(model.fit(raw.Xt, raw.yt, raw.features, raw.className, statest, raw.smoothing), "feature [petallength] not found in states");
 }
 TEST_CASE("Invalid hyperparameter", "[Classifier]")
 {
@@ -71,7 +71,7 @@ TEST_CASE("Topological order", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
-    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
    auto order = model.topological_order();
    REQUIRE(order.size() == 4);
    REQUIRE(order[0] == "petallength");
@@ -83,7 +83,7 @@ TEST_CASE("Dump_cpt", "[Classifier]")
 {
    auto model = bayesnet::TAN();
    auto raw = RawDatasets("iris", true);
-    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
    auto cpt = model.dump_cpt();
    REQUIRE(cpt.size() == 1713);
 }
@@ -111,7 +111,7 @@ TEST_CASE("KDB Graph", "[Classifier]")
 {
    auto model = bayesnet::KDB(2);
    auto raw = RawDatasets("iris", true);
-    model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    model.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto graph = model.graph();
    REQUIRE(graph.size() == 15);
 }
@@ -119,7 +119,7 @@ TEST_CASE("KDBLd Graph", "[Classifier]")
 {
    auto model = bayesnet::KDBLd(2);
    auto raw = RawDatasets("iris", false);
-    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+    model.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
    auto graph = model.graph();
    REQUIRE(graph.size() == 15);
 }
--- a/tests/TestBayesEnsemble.cc
+++ b/tests/TestBayesEnsemble.cc
@@ -18,7 +18,7 @@ TEST_CASE("Topological Order", "[Ensemble]")
 {
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::BoostAODE();
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto order = clf.topological_order();
    REQUIRE(order.size() == 0);
 }
@@ -26,7 +26,7 @@ TEST_CASE("Dump CPT", "[Ensemble]")
 {
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::BoostAODE();
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto dump = clf.dump_cpt();
    REQUIRE(dump == "");
 }
@@ -34,7 +34,7 @@ TEST_CASE("Number of States", "[Ensemble]")
 {
    auto clf = bayesnet::BoostAODE();
    auto raw = RawDatasets("iris", true);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfStates() == 76);
 }
 TEST_CASE("Show", "[Ensemble]")
@@ -46,7 +46,7 @@ TEST_CASE("Show", "[Ensemble]")
            {"maxTolerance", 1},
            {"convergence", false},
        });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    std::vector<std::string> expected = {
        "class -> sepallength, sepalwidth, petallength, petalwidth, ",
        "petallength -> sepallength, sepalwidth, petalwidth, ",
@@ -78,16 +78,16 @@ TEST_CASE("Graph", "[Ensemble]")
 {
    auto clf = bayesnet::BoostAODE();
    auto raw = RawDatasets("iris", true);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto graph = clf.graph();
    REQUIRE(graph.size() == 56);
    auto clf2 = bayesnet::AODE();
-    clf2.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf2.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    graph = clf2.graph();
    REQUIRE(graph.size() == 56);
    raw = RawDatasets("glass", false);
    auto clf3 = bayesnet::AODELd();
-    clf3.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+    clf3.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
    graph = clf3.graph();
    REQUIRE(graph.size() == 261);
 }
--- a/tests/TestBayesModels.cc
+++ b/tests/TestBayesModels.cc
@@ -54,7 +54,7 @@ TEST_CASE("Test Bayesian Classifiers score & version", "[Models]")
            auto clf = models[name];
            auto discretize = name.substr(name.length() - 2) != "Ld";
            auto raw = RawDatasets(file_name, discretize);
-            clf->fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+            clf->fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
            auto score = clf->score(raw.Xt, raw.yt);
            INFO("Classifier: " << name << " File: " << file_name);
            REQUIRE(score == Catch::Approx(scores[{file_name, name}]).epsilon(raw.epsilon));
@@ -81,7 +81,7 @@ TEST_CASE("Models features & Graph", "[Models]")
    {
        auto raw = RawDatasets("iris", true);
        auto clf = bayesnet::TAN();
-        clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+        clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
        REQUIRE(clf.getNumberOfNodes() == 5);
        REQUIRE(clf.getNumberOfEdges() == 7);
        REQUIRE(clf.getNumberOfStates() == 19);
@@ -93,7 +93,7 @@ TEST_CASE("Models features & Graph", "[Models]")
    {
        auto clf = bayesnet::TANLd();
        auto raw = RawDatasets("iris", false);
-        clf.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+        clf.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
        REQUIRE(clf.getNumberOfNodes() == 5);
        REQUIRE(clf.getNumberOfEdges() == 7);
        REQUIRE(clf.getNumberOfStates() == 19);
@@ -106,7 +106,7 @@ TEST_CASE("Get num features & num edges", "[Models]")
 {
    auto raw = RawDatasets("iris", true);
    auto clf = bayesnet::KDB(2);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 5);
    REQUIRE(clf.getNumberOfEdges() == 8);
 }
@@ -166,7 +166,7 @@ TEST_CASE("Model predict_proba", "[Models]")
    SECTION("Test " + model + " predict_proba")
    {
        auto clf = models[model];
-        clf->fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+        clf->fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
        auto y_pred_proba = clf->predict_proba(raw.Xv);
        auto yt_pred_proba = clf->predict_proba(raw.Xt);
        auto y_pred = clf->predict(raw.Xv);
@@ -203,7 +203,7 @@ TEST_CASE("AODE voting-proba", "[Models]")
 {
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::AODE(false);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto score_proba = clf.score(raw.Xv, raw.yv);
    auto pred_proba = clf.predict_proba(raw.Xv);
    clf.setHyperparameters({
@@ -222,9 +222,9 @@ TEST_CASE("SPODELd dataset", "[Models]")
    auto raw = RawDatasets("iris", false);
    auto clf = bayesnet::SPODELd(0);
    // raw.dataset.to(torch::kFloat32);
-    clf.fit(raw.dataset, raw.features, raw.className, raw.states);
+    clf.fit(raw.dataset, raw.features, raw.className, raw.states, raw.smoothing);
    auto score = clf.score(raw.Xt, raw.yt);
-    clf.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xt, raw.yt, raw.features, raw.className, raw.states, raw.smoothing);
    auto scoret = clf.score(raw.Xt, raw.yt);
    REQUIRE(score == Catch::Approx(0.97333f).epsilon(raw.epsilon));
    REQUIRE(scoret == Catch::Approx(0.97333f).epsilon(raw.epsilon));
@@ -233,13 +233,13 @@ TEST_CASE("KDB with hyperparameters", "[Models]")
 {
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::KDB(2);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto score = clf.score(raw.Xv, raw.yv);
    clf.setHyperparameters({
        {"k", 3},
        {"theta", 0.7},
        });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto scoret = clf.score(raw.Xv, raw.yv);
    REQUIRE(score == Catch::Approx(0.827103).epsilon(raw.epsilon));
    REQUIRE(scoret == Catch::Approx(0.761682).epsilon(raw.epsilon));
@@ -248,7 +248,7 @@ TEST_CASE("Incorrect type of data for SPODELd", "[Models]")
 {
    auto raw = RawDatasets("iris", true);
    auto clf = bayesnet::SPODELd(0);
-    REQUIRE_THROWS_AS(clf.fit(raw.dataset, raw.features, raw.className, raw.states), std::runtime_error);
+    REQUIRE_THROWS_AS(clf.fit(raw.dataset, raw.features, raw.className, raw.states, raw.smoothing), std::runtime_error);
 }
 TEST_CASE("Predict, predict_proba & score without fitting", "[Models]")
 {
--- a/tests/TestBayesNetwork.cc
+++ b/tests/TestBayesNetwork.cc
@@ -115,9 +115,9 @@ TEST_CASE("Test Bayesian Network", "[Network]")
            REQUIRE(children == children3);
        }
        // Fit networks
-        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
-        net2.fit(raw.dataset, raw.weights, raw.features, raw.className, raw.states);
-        net3.fit(raw.Xt, raw.yt, raw.weights, raw.features, raw.className, raw.states);
+        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
+        net2.fit(raw.dataset, raw.weights, raw.features, raw.className, raw.states, raw.smoothing);
+        net3.fit(raw.Xt, raw.yt, raw.weights, raw.features, raw.className, raw.states, raw.smoothing);
        REQUIRE(net.getStates() == net2.getStates());
        REQUIRE(net.getStates() == net3.getStates());
        REQUIRE(net.getFeatures() == net2.getFeatures());
@@ -194,7 +194,7 @@ TEST_CASE("Test Bayesian Network", "[Network]")
    SECTION("Test predict")
    {
        buildModel(net, raw.features, raw.className);
-        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
        std::vector<std::vector<int>> test = { {1, 2, 0, 1, 1}, {0, 1, 2, 0, 1}, {0, 0, 0, 0, 1}, {2, 2, 2, 2, 1} };
        std::vector<int> y_test = { 2, 2, 0, 2, 1 };
        auto y_pred = net.predict(test);
@@ -203,7 +203,7 @@ TEST_CASE("Test Bayesian Network", "[Network]")
    SECTION("Test predict_proba")
    {
        buildModel(net, raw.features, raw.className);
-        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
        std::vector<std::vector<int>> test = { {1, 2, 0, 1, 1}, {0, 1, 2, 0, 1}, {0, 0, 0, 0, 1}, {2, 2, 2, 2, 1} };
        std::vector<std::vector<double>> y_test = {
            {0.450237, 0.0866621, 0.463101},
@@ -224,14 +224,14 @@ TEST_CASE("Test Bayesian Network", "[Network]")
    SECTION("Test score")
    {
        buildModel(net, raw.features, raw.className);
-        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
        auto score = net.score(raw.Xv, raw.yv);
        REQUIRE(score == Catch::Approx(0.97333333).margin(threshold));
    }
    SECTION("Copy constructor")
    {
        buildModel(net, raw.features, raw.className);
-        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+        net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
        auto net2 = bayesnet::Network(net);
        REQUIRE(net.getFeatures() == net2.getFeatures());
        REQUIRE(net.getEdges() == net2.getEdges());
@@ -268,7 +268,7 @@ TEST_CASE("Test Bayesian Network", "[Network]")
        // predict with wrong data
        auto netx = bayesnet::Network();
        buildModel(netx, raw.features, raw.className);
-        netx.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+        netx.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
        std::vector<std::vector<int>> test2 = { {1, 2, 0, 1, 1}, {0, 1, 2, 0, 1}, {0, 0, 0, 0, 1} };
        auto test_tensor2 = bayesnet::vectorToTensor(test2, false);
        REQUIRE_THROWS_AS(netx.predict(test2), std::logic_error);
@@ -278,17 +278,17 @@ TEST_CASE("Test Bayesian Network", "[Network]")
        // fit with wrong data
        // Weights
        auto net2 = bayesnet::Network();
-        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, std::vector<double>(), raw.features, raw.className, raw.states), std::invalid_argument);
+        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, std::vector<double>(), raw.features, raw.className, raw.states, raw.smoothing), std::invalid_argument);
        std::string invalid_weights = "Weights (0) must have the same number of elements as samples (150) in Network::fit";
-        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, std::vector<double>(), raw.features, raw.className, raw.states), invalid_weights);
+        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, std::vector<double>(), raw.features, raw.className, raw.states, raw.smoothing), invalid_weights);
        // X & y
        std::string invalid_labels = "X and y must have the same number of samples in Network::fit (150 != 0)";
-        REQUIRE_THROWS_AS(net2.fit(raw.Xv, std::vector<int>(), raw.weightsv, raw.features, raw.className, raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, std::vector<int>(), raw.weightsv, raw.features, raw.className, raw.states), invalid_labels);
+        REQUIRE_THROWS_AS(net2.fit(raw.Xv, std::vector<int>(), raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, std::vector<int>(), raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing), invalid_labels);
        // Features
        std::string invalid_features = "X and features must have the same number of features in Network::fit (4 != 0)";
-        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, raw.weightsv, std::vector<std::string>(), raw.className, raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, raw.weightsv, std::vector<std::string>(), raw.className, raw.states), invalid_features);
+        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, raw.weightsv, std::vector<std::string>(), raw.className, raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, raw.weightsv, std::vector<std::string>(), raw.className, raw.states, raw.smoothing), invalid_features);
        // Different number of features
        auto net3 = bayesnet::Network();
        auto test2y = { 1, 2, 3, 4, 5 };
@@ -296,23 +296,23 @@ TEST_CASE("Test Bayesian Network", "[Network]")
        auto features3 = raw.features;
        features3.pop_back();
        std::string invalid_features2 = "X and local features must have the same number of features in Network::fit (3 != 4)";
-        REQUIRE_THROWS_AS(net3.fit(test2, test2y, std::vector<double>(5, 0), features3, raw.className, raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net3.fit(test2, test2y, std::vector<double>(5, 0), features3, raw.className, raw.states), invalid_features2);
+        REQUIRE_THROWS_AS(net3.fit(test2, test2y, std::vector<double>(5, 0), features3, raw.className, raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net3.fit(test2, test2y, std::vector<double>(5, 0), features3, raw.className, raw.states, raw.smoothing), invalid_features2);
        // Uninitialized network
        std::string network_invalid = "The network has not been initialized. You must call addNode() before calling fit()";
-        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states), network_invalid);
+        REQUIRE_THROWS_AS(net2.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net2.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states, raw.smoothing), network_invalid);
        // Classname
        std::string invalid_classname = "Class Name not found in Network::features";
-        REQUIRE_THROWS_AS(net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states), invalid_classname);
+        REQUIRE_THROWS_AS(net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, "duck", raw.states, raw.smoothing), invalid_classname);
        // Invalid feature
        auto features2 = raw.features;
        features2.pop_back();
        features2.push_back("duck");
        std::string invalid_feature = "Feature duck not found in Network::features";
-        REQUIRE_THROWS_AS(net.fit(raw.Xv, raw.yv, raw.weightsv, features2, raw.className, raw.states), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net.fit(raw.Xv, raw.yv, raw.weightsv, features2, raw.className, raw.states), invalid_feature);
+        REQUIRE_THROWS_AS(net.fit(raw.Xv, raw.yv, raw.weightsv, features2, raw.className, raw.states, raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net.fit(raw.Xv, raw.yv, raw.weightsv, features2, raw.className, raw.states, raw.smoothing), invalid_feature);
        // Add twice the same node name to the network => Nothing should happen
        net.addNode("A");
        net.addNode("A");
@@ -320,8 +320,8 @@ TEST_CASE("Test Bayesian Network", "[Network]")
        auto net4 = bayesnet::Network();
        buildModel(net4, raw.features, raw.className);
        std::string invalid_state = "Feature sepallength not found in states";
-        REQUIRE_THROWS_AS(net4.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, std::map<std::string, std::vector<int>>()), std::invalid_argument);
-        REQUIRE_THROWS_WITH(net4.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, std::map<std::string, std::vector<int>>()), invalid_state);
+        REQUIRE_THROWS_AS(net4.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, std::map<std::string, std::vector<int>>(), raw.smoothing), std::invalid_argument);
+        REQUIRE_THROWS_WITH(net4.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, std::map<std::string, std::vector<int>>(), raw.smoothing), invalid_state);
    }

 }
@@ -366,7 +366,7 @@ TEST_CASE("Dump CPT", "[Network]")
    auto net = bayesnet::Network();
    auto raw = RawDatasets("iris", true);
    buildModel(net, raw.features, raw.className);
-    net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states);
+    net.fit(raw.Xv, raw.yv, raw.weightsv, raw.features, raw.className, raw.states, raw.smoothing);
    auto res = net.dump_cpt();
    std::string expected = R"(* class: (3) : [3]
 0.3333
--- a/tests/TestBoostA2DE.cc
+++ b/tests/TestBoostA2DE.cc
@@ -17,7 +17,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 {
    auto raw = RawDatasets("diabetes", true);
    auto clf = bayesnet::BoostA2DE();
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 342);
    REQUIRE(clf.getNumberOfEdges() == 684);
    REQUIRE(clf.getNotes().size() == 3);
@@ -32,7 +32,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //     auto raw = RawDatasets("glass", true);
 //     auto clf = bayesnet::BoostAODE();
 //     clf.setHyperparameters({ {"select_features", "IWSS"}, {"threshold", 0.5 } });
-//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
 //     REQUIRE(clf.getNumberOfNodes() == 90);
 //     REQUIRE(clf.getNumberOfEdges() == 153);
 //     REQUIRE(clf.getNotes().size() == 2);
@@ -44,7 +44,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //     auto raw = RawDatasets("glass", true);
 //     auto clf = bayesnet::BoostAODE();
 //     clf.setHyperparameters({ {"select_features", "FCBF"}, {"threshold", 1e-7 } });
-//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
 //     REQUIRE(clf.getNumberOfNodes() == 90);
 //     REQUIRE(clf.getNumberOfEdges() == 153);
 //     REQUIRE(clf.getNotes().size() == 2);
@@ -60,7 +60,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //         {"convergence", true},
 //         {"select_features","CFS"},
 //         });
-//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
 //     REQUIRE(clf.getNumberOfNodes() == 72);
 //     REQUIRE(clf.getNumberOfEdges() == 120);
 //     REQUIRE(clf.getNotes().size() == 2);
@@ -75,7 +75,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 // {
 //     auto raw = RawDatasets("iris", true);
 //     auto clf = bayesnet::BoostAODE(false);
-//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
 //     auto score_proba = clf.score(raw.Xv, raw.yv);
 //     auto pred_proba = clf.predict_proba(raw.Xv);
 //     clf.setHyperparameters({
@@ -104,7 +104,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //             {"maxTolerance", 1},
 //             {"convergence", false},
 //             });
-//         clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+//         clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
 //         auto score = clf.score(raw.Xv, raw.yv);
 //         auto scoret = clf.score(raw.Xt, raw.yt);
 //         INFO("BoostAODE order: " + order);
@@ -136,7 +136,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //     for (const auto& hyper : bad_hyper_fit.items()) {
 //         INFO("BoostAODE hyper: " + hyper.value().dump());
 //         clf.setHyperparameters(hyper.value());
-//         REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states), std::invalid_argument);
+//         REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing, std::invalid_argument);
 //     }
 // }

@@ -151,7 +151,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //         {"block_update", false},
 //         {"convergence_best", false},
 //         });
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
 //     REQUIRE(clf.getNumberOfNodes() == 210);
 //     REQUIRE(clf.getNumberOfEdges() == 378);
 //     REQUIRE(clf.getNotes().size() == 1);
@@ -172,13 +172,13 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //         {"convergence_best", true},
 //     };
 //     clf.setHyperparameters(hyperparameters);
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
 //     auto score_best = clf.score(raw.X_test, raw.y_test);
 //     REQUIRE(score_best == Catch::Approx(0.980000019f).epsilon(raw.epsilon));
 //     // Now we will set the hyperparameter to use the last accuracy
 //     hyperparameters["convergence_best"] = false;
 //     clf.setHyperparameters(hyperparameters);
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
 //     auto score_last = clf.score(raw.X_test, raw.y_test);
 //     REQUIRE(score_last == Catch::Approx(0.976666689f).epsilon(raw.epsilon));
 // }
@@ -193,7 +193,7 @@ TEST_CASE("Build basic model", "[BoostA2DE]")
 //         {"maxTolerance", 3},
 //         {"convergence", true},
 //         });
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
 //     REQUIRE(clf.getNumberOfNodes() == 868);
 //     REQUIRE(clf.getNumberOfEdges() == 1724);
 //     REQUIRE(clf.getNotes().size() == 3);
--- a/tests/TestBoostAODE.cc
+++ b/tests/TestBoostAODE.cc
@@ -18,7 +18,7 @@ TEST_CASE("Feature_select CFS", "[BoostAODE]")
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::BoostAODE();
    clf.setHyperparameters({ {"select_features", "CFS"} });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 90);
    REQUIRE(clf.getNumberOfEdges() == 153);
    REQUIRE(clf.getNotes().size() == 2);
@@ -30,7 +30,7 @@ TEST_CASE("Feature_select IWSS", "[BoostAODE]")
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::BoostAODE();
    clf.setHyperparameters({ {"select_features", "IWSS"}, {"threshold", 0.5 } });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 90);
    REQUIRE(clf.getNumberOfEdges() == 153);
    REQUIRE(clf.getNotes().size() == 2);
@@ -42,7 +42,7 @@ TEST_CASE("Feature_select FCBF", "[BoostAODE]")
    auto raw = RawDatasets("glass", true);
    auto clf = bayesnet::BoostAODE();
    clf.setHyperparameters({ {"select_features", "FCBF"}, {"threshold", 1e-7 } });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 90);
    REQUIRE(clf.getNumberOfEdges() == 153);
    REQUIRE(clf.getNotes().size() == 2);
@@ -58,7 +58,7 @@ TEST_CASE("Test used features in train note and score", "[BoostAODE]")
        {"convergence", true},
        {"select_features","CFS"},
        });
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 72);
    REQUIRE(clf.getNumberOfEdges() == 120);
    REQUIRE(clf.getNotes().size() == 2);
@@ -73,7 +73,7 @@ TEST_CASE("Voting vs proba", "[BoostAODE]")
 {
    auto raw = RawDatasets("iris", true);
    auto clf = bayesnet::BoostAODE(false);
-    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+    clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
    auto score_proba = clf.score(raw.Xv, raw.yv);
    auto pred_proba = clf.predict_proba(raw.Xv);
    clf.setHyperparameters({
@@ -102,7 +102,7 @@ TEST_CASE("Order asc, desc & random", "[BoostAODE]")
            {"maxTolerance", 1},
            {"convergence", false},
            });
-        clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states);
+        clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
        auto score = clf.score(raw.Xv, raw.yv);
        auto scoret = clf.score(raw.Xt, raw.yt);
        INFO("BoostAODE order: " << order);
@@ -134,7 +134,7 @@ TEST_CASE("Oddities", "[BoostAODE]")
    for (const auto& hyper : bad_hyper_fit.items()) {
        INFO("BoostAODE hyper: " << hyper.value().dump());
        clf.setHyperparameters(hyper.value());
-        REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states), std::invalid_argument);
+        REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing), std::invalid_argument);
    }
 }

@@ -149,7 +149,7 @@ TEST_CASE("Bisection Best", "[BoostAODE]")
        {"block_update", false},
        {"convergence_best", false},
        });
-    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 210);
    REQUIRE(clf.getNumberOfEdges() == 378);
    REQUIRE(clf.getNotes().size() == 1);
@@ -170,13 +170,13 @@ TEST_CASE("Bisection Best vs Last", "[BoostAODE]")
        {"convergence_best", true},
    };
    clf.setHyperparameters(hyperparameters);
-    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
    auto score_best = clf.score(raw.X_test, raw.y_test);
    REQUIRE(score_best == Catch::Approx(0.980000019f).epsilon(raw.epsilon));
    // Now we will set the hyperparameter to use the last accuracy
    hyperparameters["convergence_best"] = false;
    clf.setHyperparameters(hyperparameters);
-    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
    auto score_last = clf.score(raw.X_test, raw.y_test);
    REQUIRE(score_last == Catch::Approx(0.976666689f).epsilon(raw.epsilon));
 }
@@ -191,7 +191,7 @@ TEST_CASE("Block Update", "[BoostAODE]")
        {"maxTolerance", 3},
        {"convergence", true},
        });
-    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
    REQUIRE(clf.getNumberOfNodes() == 868);
    REQUIRE(clf.getNumberOfEdges() == 1724);
    REQUIRE(clf.getNotes().size() == 3);
--- a/tests/TestModulesVersions.cc
+++ b/tests/TestModulesVersions.cc
@@ -16,7 +16,7 @@
 #include "TestUtils.h"

 std::map<std::string, std::string> modules = {
-    { "mdlp", "1.2.0" },
+    { "mdlp", "1.2.1" },
    { "Folding", "1.1.0" },
    { "json", "3.11" },
    { "ArffFiles", "1.0.0" }
--- a/tests/TestUtils.h
+++ b/tests/TestUtils.h
@@ -14,6 +14,7 @@
 #include <ArffFiles.hpp>
 #include <CPPFImdlp.h>
 #include <folding.hpp>
+#include <bayesnet/network/Network.h>


 class RawDatasets {
@@ -32,6 +33,7 @@ public:
    bool discretize;
    int num_samples = 0;
    bool shuffle = false;
+    bayesnet::Smoothing_t smoothing = bayesnet::Smoothing_t::OLD_LAPLACE;
 private:
    std::string to_string()
    {