TestXBAODE complete, fix XBAODE error in no convergence & 99% coverage

2025-03-13 01:28:48 +01:00
parent b1d317d8f4
commit 4ded6f51eb
3 changed files with 308 additions and 348 deletions
--- a/README.md
+++ b/README.md
@@ -7,7 +7,7 @@
 [![Security Rating](https://sonarcloud.io/api/project_badges/measure?project=rmontanana_BayesNet&metric=security_rating)](https://sonarcloud.io/summary/new_code?id=rmontanana_BayesNet)
 [![Reliability Rating](https://sonarcloud.io/api/project_badges/measure?project=rmontanana_BayesNet&metric=reliability_rating)](https://sonarcloud.io/summary/new_code?id=rmontanana_BayesNet)
 ![Gitea Last Commit](https://img.shields.io/gitea/last-commit/rmontanana/bayesnet?gitea_url=https://gitea.rmontanana.es:3000&logo=gitea)
-[![Coverage Badge](https://img.shields.io/badge/Coverage-98,2%25-green)](html/index.html)
+[![Coverage Badge](https://img.shields.io/badge/Coverage-99,0%25-green)](html/index.html)
 [![DOI](https://zenodo.org/badge/667782806.svg)](https://doi.org/10.5281/zenodo.14210344)

 Bayesian Network Classifiers library
--- a/bayesnet/ensembles/XBAODE.cc
+++ b/bayesnet/ensembles/XBAODE.cc
@@ -12,191 +12,183 @@

 namespace bayesnet {
 XBAODE::XBAODE() : Boost(false) {
-  validHyperparameters = {
-      "alpha_block",      "order",          "convergence",
-      "convergence_best", "bisection",      "threshold",
-      "maxTolerance",     "predict_voting", "select_features"};
+    validHyperparameters = {"alpha_block", "order",        "convergence",    "convergence_best", "bisection",
+                            "threshold",   "maxTolerance", "predict_voting", "select_features"};
 }
 void XBAODE::add_model(std::unique_ptr<Classifier> model, double significance) {
-  models.push_back(std::move(model));
-  n_models++;
-  significanceModels.push_back(significance);
+    models.push_back(std::move(model));
+    n_models++;
+    significanceModels.push_back(significance);
 }
 void XBAODE::remove_last_model() {
-  models.pop_back();
-  significanceModels.pop_back();
-  n_models--;
+    models.pop_back();
+    significanceModels.pop_back();
+    n_models--;
 }
 std::vector<int> XBAODE::initializeModels(const Smoothing_t smoothing) {
-  torch::Tensor weights_ = torch::full({m}, 1.0 / m, torch::kFloat64);
-  std::vector<int> featuresSelected = featureSelection(weights_);
-  for (const int &feature : featuresSelected) {
-    std::unique_ptr<Classifier> model = std::make_unique<XSpode>(feature);
-    model->fit(dataset, features, className, states, weights_, smoothing);
-    add_model(std::move(model), 1.0);
-  }
-  notes.push_back("Used features in initialization: " +
-                  std::to_string(featuresSelected.size()) + " of " +
-                  std::to_string(features.size()) + " with " +
-                  select_features_algorithm);
-  return featuresSelected;
-}
-void XBAODE::trainModel(const torch::Tensor &weights,
-                        const bayesnet::Smoothing_t smoothing) {
-  X_train_ = TensorUtils::to_matrix(X_train);
-  y_train_ = TensorUtils::to_vector<int>(y_train);
-  X_test_ = TensorUtils::to_matrix(X_test);
-  y_test_ = TensorUtils::to_vector<int>(y_test);
-  fitted = true;
-  double alpha_t;
-  torch::Tensor weights_ = torch::full({m}, 1.0 / m, torch::kFloat64);
-  bool finished = false;
-  std::vector<int> featuresUsed;
-  n_models = 0;
-  if (selectFeatures) {
-    featuresUsed = initializeModels(smoothing);
-    auto ypred = predict(X_train_);
-    auto ypred_t = torch::tensor(ypred);
-    std::tie(weights_, alpha_t, finished) =
-        update_weights(y_train, ypred_t, weights_);
-    // Update significance of the models
-    for (const int &feature : featuresUsed) {
-      significanceModels.pop_back();
-    }
-    for (const int &feature : featuresUsed) {
-      significanceModels.push_back(alpha_t);
-    }
-    // VLOG_SCOPE_F(1, "SelectFeatures. alpha_t: %f n_models: %d", alpha_t,
-    // n_models);
-    if (finished) {
-      return;
-    }
-  }
-  int numItemsPack =
-      0; // The counter of the models inserted in the current pack
-  // Variables to control the accuracy finish condition
-  double priorAccuracy = 0.0;
-  double improvement = 1.0;
-  double convergence_threshold = 1e-4;
-  int tolerance =
-      0; // number of times the accuracy is lower than the convergence_threshold
-  // Step 0: Set the finish condition
-  // epsilon sub t > 0.5 => inverse the weights_ policy
-  // validation error is not decreasing
-  // run out of features
-  bool ascending = order_algorithm == bayesnet::Orders.ASC;
-  std::mt19937 g{173};
-  while (!finished) {
-    // Step 1: Build ranking with mutual information
-    auto featureSelection = metrics.SelectKBestWeighted(
-        weights_, ascending, n); // Get all the features sorted
-    if (order_algorithm == bayesnet::Orders.RAND) {
-      std::shuffle(featureSelection.begin(), featureSelection.end(), g);
-    }
-    // Remove used features
-    featureSelection.erase(
-        remove_if(featureSelection.begin(), featureSelection.end(), [&](auto x) {
-                    return std::find(featuresUsed.begin(), featuresUsed.end(), x) != featuresUsed.end();
-                  }),
-        featureSelection.end());
-    int k = bisection ? pow(2, tolerance) : 1;
-    int counter = 0; // The model counter of the current pack
-    // VLOG_SCOPE_F(1, "counter=%d k=%d featureSelection.size: %zu", counter, k,
-    // featureSelection.size());
-    while (counter++ < k && featureSelection.size() > 0) {
-      auto feature = featureSelection[0];
-      featureSelection.erase(featureSelection.begin());
-      std::unique_ptr<Classifier> model;
-      model = std::make_unique<XSpode>(feature);
-      model->fit(dataset, features, className, states, weights_, smoothing);
-      /*dynamic_cast<XSpode*>(model.get())->fitx(X_train, y_train, weights_,
-       * smoothing); // using exclusive XSpode fit method*/
-      // DEBUG
-      /*std::cout << dynamic_cast<XSpode*>(model.get())->to_string() <<
-       * std::endl;*/
-      // DEBUG
-      std::vector<int> ypred;
-      if (alpha_block) {
-        //
-        // Compute the prediction with the current ensemble + model
-        //
-        // Add the model to the ensemble
+    torch::Tensor weights_ = torch::full({m}, 1.0 / m, torch::kFloat64);
+    std::vector<int> featuresSelected = featureSelection(weights_);
+    for (const int &feature : featuresSelected) {
+        std::unique_ptr<Classifier> model = std::make_unique<XSpode>(feature);
+        model->fit(dataset, features, className, states, weights_, smoothing);
        add_model(std::move(model), 1.0);
-        // Compute the prediction
-        ypred = predict(X_train_);
-        // Remove the model from the ensemble
-        remove_last_model();
-      } else {
-        ypred = model->predict(X_train_);
-      }
-      // Step 3.1: Compute the classifier amout of say
-      auto ypred_t = torch::tensor(ypred);
-      std::tie(weights_, alpha_t, finished) = update_weights(y_train, ypred_t, weights_);
-      // Step 3.4: Store classifier and its accuracy to weigh its future vote
-      numItemsPack++;
-      featuresUsed.push_back(feature);
-      add_model(std::move(model), alpha_t);
-      // VLOG_SCOPE_F(2, "finished: %d numItemsPack: %d n_models: %d
-      // featuresUsed: %zu", finished, numItemsPack, n_models,
-      // featuresUsed.size());
-    } // End of the pack
-    if (convergence && !finished) {
-      auto y_val_predict = predict(X_test);
-      double accuracy = (y_val_predict == y_test).sum().item<double>() /
-                        (double)y_test.size(0);
-      if (priorAccuracy == 0) {
-        priorAccuracy = accuracy;
-      } else {
-        improvement = accuracy - priorAccuracy;
-      }
-      if (improvement < convergence_threshold) {
-        // VLOG_SCOPE_F(3, "  (improvement<threshold) tolerance: %d
-        // numItemsPack: %d improvement: %f prior: %f current: %f", tolerance,
-        // numItemsPack, improvement, priorAccuracy, accuracy);
-        tolerance++;
-      } else {
-        // VLOG_SCOPE_F(3, "* (improvement>=threshold) Reset. tolerance: %d
-        // numItemsPack: %d improvement: %f prior: %f current: %f", tolerance,
-        // numItemsPack, improvement, priorAccuracy, accuracy);
-        tolerance = 0; // Reset the counter if the model performs better
-        numItemsPack = 0;
-      }
-      if (convergence_best) {
-        // Keep the best accuracy until now as the prior accuracy
-        priorAccuracy = std::max(accuracy, priorAccuracy);
-      } else {
-        // Keep the last accuray obtained as the prior accuracy
-        priorAccuracy = accuracy;
-      }
    }
-    // VLOG_SCOPE_F(1, "tolerance: %d featuresUsed.size: %zu features.size:
-    // %zu", tolerance, featuresUsed.size(), features.size());
-    finished = finished || tolerance > maxTolerance ||
-               featuresUsed.size() == features.size();
-  }
-  if (tolerance > maxTolerance) {
-    if (numItemsPack < n_models) {
-      notes.push_back("Convergence threshold reached & " +
-                      std::to_string(numItemsPack) + " models eliminated");
-      // VLOG_SCOPE_F(4, "Convergence threshold reached & %d models eliminated
-      // of %d", numItemsPack, n_models);
-      for (int i = featuresUsed.size() - 1;
-           i >= featuresUsed.size() - numItemsPack; --i) {
-        remove_last_model();
-      }
-      // VLOG_SCOPE_F(4, "*Convergence threshold %d models left & %d features
-      // used.", n_models, featuresUsed.size());
-    } else {
-      notes.push_back("Convergence threshold reached & 0 models eliminated");
-      // VLOG_SCOPE_F(4, "Convergence threshold reached & 0 models eliminated
-      // n_models=%d numItemsPack=%d", n_models, numItemsPack);
+    notes.push_back("Used features in initialization: " + std::to_string(featuresSelected.size()) + " of " +
+                    std::to_string(features.size()) + " with " + select_features_algorithm);
+    return featuresSelected;
+}
+void XBAODE::trainModel(const torch::Tensor &weights, const bayesnet::Smoothing_t smoothing) {
+    X_train_ = TensorUtils::to_matrix(X_train);
+    y_train_ = TensorUtils::to_vector<int>(y_train);
+    if (convergence) {
+        X_test_ = TensorUtils::to_matrix(X_test);
+        y_test_ = TensorUtils::to_vector<int>(y_test);
    }
-  }
-  if (featuresUsed.size() != features.size()) {
-    notes.push_back( "Used features in train: " + std::to_string(featuresUsed.size()) + " of " + std::to_string(features.size()));
-    status = bayesnet::WARNING;
-  }
-  notes.push_back("Number of models: " + std::to_string(n_models));
-  return;
+    fitted = true;
+    double alpha_t;
+    torch::Tensor weights_ = torch::full({m}, 1.0 / m, torch::kFloat64);
+    bool finished = false;
+    std::vector<int> featuresUsed;
+    n_models = 0;
+    if (selectFeatures) {
+        featuresUsed = initializeModels(smoothing);
+        auto ypred = predict(X_train_);
+        auto ypred_t = torch::tensor(ypred);
+        std::tie(weights_, alpha_t, finished) = update_weights(y_train, ypred_t, weights_);
+        // Update significance of the models
+        for (const int &feature : featuresUsed) {
+            significanceModels.pop_back();
+        }
+        for (const int &feature : featuresUsed) {
+            significanceModels.push_back(alpha_t);
+        }
+        // VLOG_SCOPE_F(1, "SelectFeatures. alpha_t: %f n_models: %d", alpha_t,
+        // n_models);
+        if (finished) {
+            return;
+        }
+    }
+    int numItemsPack = 0; // The counter of the models inserted in the current pack
+    // Variables to control the accuracy finish condition
+    double priorAccuracy = 0.0;
+    double improvement = 1.0;
+    double convergence_threshold = 1e-4;
+    int tolerance = 0; // number of times the accuracy is lower than the convergence_threshold
+    // Step 0: Set the finish condition
+    // epsilon sub t > 0.5 => inverse the weights_ policy
+    // validation error is not decreasing
+    // run out of features
+    bool ascending = order_algorithm == bayesnet::Orders.ASC;
+    std::mt19937 g{173};
+    while (!finished) {
+        // Step 1: Build ranking with mutual information
+        auto featureSelection = metrics.SelectKBestWeighted(weights_, ascending, n); // Get all the features sorted
+        if (order_algorithm == bayesnet::Orders.RAND) {
+            std::shuffle(featureSelection.begin(), featureSelection.end(), g);
+        }
+        // Remove used features
+        featureSelection.erase(remove_if(featureSelection.begin(), featureSelection.end(),
+                                         [&](auto x) {
+                                             return std::find(featuresUsed.begin(), featuresUsed.end(), x) !=
+                                                    featuresUsed.end();
+                                         }),
+                               featureSelection.end());
+        int k = bisection ? pow(2, tolerance) : 1;
+        int counter = 0; // The model counter of the current pack
+        // VLOG_SCOPE_F(1, "counter=%d k=%d featureSelection.size: %zu", counter, k,
+        // featureSelection.size());
+        while (counter++ < k && featureSelection.size() > 0) {
+            auto feature = featureSelection[0];
+            featureSelection.erase(featureSelection.begin());
+            std::unique_ptr<Classifier> model;
+            model = std::make_unique<XSpode>(feature);
+            model->fit(dataset, features, className, states, weights_, smoothing);
+            /*dynamic_cast<XSpode*>(model.get())->fitx(X_train, y_train, weights_,
+             * smoothing); // using exclusive XSpode fit method*/
+            // DEBUG
+            /*std::cout << dynamic_cast<XSpode*>(model.get())->to_string() <<
+             * std::endl;*/
+            // DEBUG
+            std::vector<int> ypred;
+            if (alpha_block) {
+                //
+                // Compute the prediction with the current ensemble + model
+                //
+                // Add the model to the ensemble
+                add_model(std::move(model), 1.0);
+                // Compute the prediction
+                ypred = predict(X_train_);
+                model = std::move(models.back());
+                // Remove the model from the ensemble
+                remove_last_model();
+            } else {
+                ypred = model->predict(X_train_);
+            }
+            // Step 3.1: Compute the classifier amout of say
+            auto ypred_t = torch::tensor(ypred);
+            std::tie(weights_, alpha_t, finished) = update_weights(y_train, ypred_t, weights_);
+            // Step 3.4: Store classifier and its accuracy to weigh its future vote
+            numItemsPack++;
+            featuresUsed.push_back(feature);
+            add_model(std::move(model), alpha_t);
+            // VLOG_SCOPE_F(2, "finished: %d numItemsPack: %d n_models: %d
+            // featuresUsed: %zu", finished, numItemsPack, n_models,
+            // featuresUsed.size());
+        } // End of the pack
+        if (convergence && !finished) {
+            auto y_val_predict = predict(X_test);
+            double accuracy = (y_val_predict == y_test).sum().item<double>() / (double)y_test.size(0);
+            if (priorAccuracy == 0) {
+                priorAccuracy = accuracy;
+            } else {
+                improvement = accuracy - priorAccuracy;
+            }
+            if (improvement < convergence_threshold) {
+                // VLOG_SCOPE_F(3, "  (improvement<threshold) tolerance: %d
+                // numItemsPack: %d improvement: %f prior: %f current: %f", tolerance,
+                // numItemsPack, improvement, priorAccuracy, accuracy);
+                tolerance++;
+            } else {
+                // VLOG_SCOPE_F(3, "* (improvement>=threshold) Reset. tolerance: %d
+                // numItemsPack: %d improvement: %f prior: %f current: %f", tolerance,
+                // numItemsPack, improvement, priorAccuracy, accuracy);
+                tolerance = 0; // Reset the counter if the model performs better
+                numItemsPack = 0;
+            }
+            if (convergence_best) {
+                // Keep the best accuracy until now as the prior accuracy
+                priorAccuracy = std::max(accuracy, priorAccuracy);
+            } else {
+                // Keep the last accuray obtained as the prior accuracy
+                priorAccuracy = accuracy;
+            }
+        }
+        // VLOG_SCOPE_F(1, "tolerance: %d featuresUsed.size: %zu features.size:
+        // %zu", tolerance, featuresUsed.size(), features.size());
+        finished = finished || tolerance > maxTolerance || featuresUsed.size() == features.size();
+    }
+    if (tolerance > maxTolerance) {
+        if (numItemsPack < n_models) {
+            notes.push_back("Convergence threshold reached & " + std::to_string(numItemsPack) + " models eliminated");
+            // VLOG_SCOPE_F(4, "Convergence threshold reached & %d models eliminated
+            // of %d", numItemsPack, n_models);
+            for (int i = featuresUsed.size() - 1; i >= featuresUsed.size() - numItemsPack; --i) {
+                remove_last_model();
+            }
+            // VLOG_SCOPE_F(4, "*Convergence threshold %d models left & %d features
+            // used.", n_models, featuresUsed.size());
+        } else {
+            notes.push_back("Convergence threshold reached & 0 models eliminated");
+            // VLOG_SCOPE_F(4, "Convergence threshold reached & 0 models eliminated
+            // n_models=%d numItemsPack=%d", n_models, numItemsPack);
+        }
+    }
+    if (featuresUsed.size() != features.size()) {
+        notes.push_back("Used features in train: " + std::to_string(featuresUsed.size()) + " of " +
+                        std::to_string(features.size()));
+        status = bayesnet::WARNING;
+    }
+    notes.push_back("Number of models: " + std::to_string(n_models));
+    return;
 }
 } // namespace bayesnet
--- a/tests/TestXBAODE.cc
+++ b/tests/TestXBAODE.cc
@@ -4,12 +4,12 @@
 // SPDX-License-Identifier: MIT
 // ***************************************************************

-#include "TestUtils.h"
-#include "bayesnet/ensembles/XBAODE.h"
 #include <catch2/catch_approx.hpp>
 #include <catch2/catch_test_macros.hpp>
 #include <catch2/generators/catch_generators.hpp>
 #include <catch2/matchers/catch_matchers.hpp>
+#include "TestUtils.h"
+#include "bayesnet/ensembles/XBAODE.h"

 TEST_CASE("Normal test", "[XBAODE]") {
    auto raw = RawDatasets("iris", true);
@@ -78,171 +78,139 @@ TEST_CASE("Test used features in train note and score", "[XBAODE]") {
    REQUIRE(score == Catch::Approx(0.819010437f).epsilon(raw.epsilon));
    REQUIRE(scoret == Catch::Approx(0.819010437f).epsilon(raw.epsilon));
 }
-// TEST_CASE("Voting vs proba", "[XBAODE]")
-// {
-//     auto raw = RawDatasets("iris", true);
-//     auto clf = bayesnet::XBAODE(false);
-//     clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states,
-//     raw.smoothing); auto score_proba = clf.score(raw.Xv, raw.yv); auto
-//     pred_proba = clf.predict_proba(raw.Xv); clf.setHyperparameters({
-//         {"predict_voting",true},
-//         });
-//     auto score_voting = clf.score(raw.Xv, raw.yv);
-//     auto pred_voting = clf.predict_proba(raw.Xv);
-//     REQUIRE(score_proba == Catch::Approx(0.97333).epsilon(raw.epsilon));
-//     REQUIRE(score_voting == Catch::Approx(0.98).epsilon(raw.epsilon));
-//     REQUIRE(pred_voting[83][2] == Catch::Approx(1.0).epsilon(raw.epsilon));
-//     REQUIRE(pred_proba[83][2] ==
-//     Catch::Approx(0.86121525).epsilon(raw.epsilon)); REQUIRE(clf.dump_cpt()
-//     == ""); REQUIRE(clf.topological_order() == std::vector<std::string>());
-// }
-// TEST_CASE("Order asc, desc & random", "[XBAODE]")
-// {
-//     auto raw = RawDatasets("glass", true);
-//     std::map<std::string, double> scores{
-//         {"asc", 0.83645f }, { "desc", 0.84579f }, { "rand", 0.84112 }
-//     };
-//     for (const std::string& order : { "asc", "desc", "rand" }) {
-//         auto clf = bayesnet::XBAODE();
-//         clf.setHyperparameters({
-//             {"order", order},
-//             {"bisection", false},
-//             {"maxTolerance", 1},
-//             {"convergence", false},
-//             });
-//         clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states,
-//         raw.smoothing); auto score = clf.score(raw.Xv, raw.yv); auto scoret =
-//         clf.score(raw.Xt, raw.yt); INFO("XBAODE order: " << order);
-//         REQUIRE(score == Catch::Approx(scores[order]).epsilon(raw.epsilon));
-//         REQUIRE(scoret == Catch::Approx(scores[order]).epsilon(raw.epsilon));
-//     }
-// }
-// TEST_CASE("Oddities", "[XBAODE]")
-// {
-//     auto clf = bayesnet::XBAODE();
-//     auto raw = RawDatasets("iris", true);
-//     auto bad_hyper = nlohmann::json{
-//         { { "order", "duck" } },
-//         { { "select_features", "duck" } },
-//         { { "maxTolerance", 0 } },
-//         { { "maxTolerance", 7 } },
-//     };
-//     for (const auto& hyper : bad_hyper.items()) {
-//         INFO("XBAODE hyper: " << hyper.value().dump());
-//         REQUIRE_THROWS_AS(clf.setHyperparameters(hyper.value()),
-//         std::invalid_argument);
-//     }
-//     REQUIRE_THROWS_AS(clf.setHyperparameters({ {"maxTolerance", 0 } }),
-//     std::invalid_argument); auto bad_hyper_fit = nlohmann::json{
-//         { { "select_features","IWSS" }, { "threshold", -0.01 } },
-//         { { "select_features","IWSS" }, { "threshold", 0.51 } },
-//         { { "select_features","FCBF" }, { "threshold", 1e-8 } },
-//         { { "select_features","FCBF" }, { "threshold", 1.01 } },
-//     };
-//     for (const auto& hyper : bad_hyper_fit.items()) {
-//         INFO("XBAODE hyper: " << hyper.value().dump());
-//         clf.setHyperparameters(hyper.value());
-//         REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features,
-//         raw.className, raw.states, raw.smoothing), std::invalid_argument);
-//     }
-
-//     auto bad_hyper_fit2 = nlohmann::json{
-//         { { "alpha_block", true }, { "block_update", true } },
-//         { { "bisection", false }, { "block_update", true } },
-//     };
-//     for (const auto& hyper : bad_hyper_fit2.items()) {
-//         INFO("XBAODE hyper: " << hyper.value().dump());
-//         REQUIRE_THROWS_AS(clf.setHyperparameters(hyper.value()),
-//         std::invalid_argument);
-//     }
-// }
-// TEST_CASE("Bisection Best", "[XBAODE]")
-// {
-//     auto clf = bayesnet::XBAODE();
-//     auto raw = RawDatasets("kdd_JapaneseVowels", true, 1200, true, false);
-//     clf.setHyperparameters({
-//         {"bisection", true},
-//         {"maxTolerance", 3},
-//         {"convergence", true},
-//         {"convergence_best", false},
-//         });
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className,
-//     raw.states, raw.smoothing); REQUIRE(clf.getNumberOfNodes() == 210);
-//     REQUIRE(clf.getNumberOfEdges() == 378);
-//     REQUIRE(clf.getNotes().size() == 1);
-//     REQUIRE(clf.getNotes().at(0) == "Number of models: 14");
-//     auto score = clf.score(raw.X_test, raw.y_test);
-//     auto scoret = clf.score(raw.X_test, raw.y_test);
-//     REQUIRE(score == Catch::Approx(0.991666675f).epsilon(raw.epsilon));
-//     REQUIRE(scoret == Catch::Approx(0.991666675f).epsilon(raw.epsilon));
-// }
-// TEST_CASE("Bisection Best vs Last", "[XBAODE]")
-// {
-//     auto raw = RawDatasets("kdd_JapaneseVowels", true, 1500, true, false);
-//     auto clf = bayesnet::XBAODE(true);
-//     auto hyperparameters = nlohmann::json{
-//         {"bisection", true},
-//         {"maxTolerance", 3},
-//         {"convergence", true},
-//         {"convergence_best", true},
-//     };
-//     clf.setHyperparameters(hyperparameters);
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className,
-//     raw.states, raw.smoothing); auto score_best = clf.score(raw.X_test,
-//     raw.y_test); REQUIRE(score_best ==
-//     Catch::Approx(0.980000019f).epsilon(raw.epsilon));
-//     // Now we will set the hyperparameter to use the last accuracy
-//     hyperparameters["convergence_best"] = false;
-//     clf.setHyperparameters(hyperparameters);
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className,
-//     raw.states, raw.smoothing); auto score_last = clf.score(raw.X_test,
-//     raw.y_test); REQUIRE(score_last ==
-//     Catch::Approx(0.976666689f).epsilon(raw.epsilon));
-// }
-// TEST_CASE("Block Update", "[XBAODE]")
-// {
-//     auto clf = bayesnet::XBAODE();
-//     auto raw = RawDatasets("mfeat-factors", true, 500);
-//     clf.setHyperparameters({
-//         {"bisection", true},
-//         {"block_update", true},
-//         {"maxTolerance", 3},
-//         {"convergence", true},
-//         });
-//     clf.fit(raw.X_train, raw.y_train, raw.features, raw.className,
-//     raw.states, raw.smoothing); REQUIRE(clf.getNumberOfNodes() == 868);
-//     REQUIRE(clf.getNumberOfEdges() == 1724);
-//     REQUIRE(clf.getNotes().size() == 3);
-//     REQUIRE(clf.getNotes()[0] == "Convergence threshold reached & 15 models
-//     eliminated"); REQUIRE(clf.getNotes()[1] == "Used features in train: 19 of
-//     216"); REQUIRE(clf.getNotes()[2] == "Number of models: 4"); auto score =
-//     clf.score(raw.X_test, raw.y_test); auto scoret = clf.score(raw.X_test,
-//     raw.y_test); REQUIRE(score == Catch::Approx(0.99f).epsilon(raw.epsilon));
-//     REQUIRE(scoret == Catch::Approx(0.99f).epsilon(raw.epsilon));
-//     //
-//     // std::cout << "Number of nodes " << clf.getNumberOfNodes() <<
-//     std::endl;
-//     // std::cout << "Number of edges " << clf.getNumberOfEdges() <<
-//     std::endl;
-//     // std::cout << "Notes size " << clf.getNotes().size() << std::endl;
-//     // for (auto note : clf.getNotes()) {
-//     //     std::cout << note << std::endl;
-//     // }
-//     // std::cout << "Score " << score << std::endl;
-// }
-// TEST_CASE("Alphablock", "[XBAODE]")
-// {
-//     auto clf_alpha = bayesnet::XBAODE();
-//     auto clf_no_alpha = bayesnet::XBAODE();
-//     auto raw = RawDatasets("diabetes", true);
-//     clf_alpha.setHyperparameters({
-//         {"alpha_block", true},
-//         });
-//     clf_alpha.fit(raw.X_train, raw.y_train, raw.features, raw.className,
-//     raw.states, raw.smoothing); clf_no_alpha.fit(raw.X_train, raw.y_train,
-//     raw.features, raw.className, raw.states, raw.smoothing); auto score_alpha
-//     = clf_alpha.score(raw.X_test, raw.y_test); auto score_no_alpha =
-//     clf_no_alpha.score(raw.X_test, raw.y_test); REQUIRE(score_alpha ==
-//     Catch::Approx(0.720779f).epsilon(raw.epsilon)); REQUIRE(score_no_alpha ==
-//     Catch::Approx(0.733766f).epsilon(raw.epsilon));
-// }
+TEST_CASE("Order asc, desc & random", "[XBAODE]") {
+    auto raw = RawDatasets("glass", true);
+    std::map<std::string, double> scores{{"asc", 0.83645f}, {"desc", 0.84579f}, {"rand", 0.84112}};
+    for (const std::string &order : {"asc", "desc", "rand"}) {
+        auto clf = bayesnet::XBAODE();
+        clf.setHyperparameters({
+            {"order", order},
+            {"bisection", false},
+            {"maxTolerance", 1},
+            {"convergence", false},
+        });
+        clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing);
+        auto score = clf.score(raw.Xv, raw.yv);
+        auto scoret = clf.score(raw.Xt, raw.yt);
+        INFO("XBAODE order: " << order);
+        REQUIRE(score == Catch::Approx(scores[order]).epsilon(raw.epsilon));
+        REQUIRE(scoret == Catch::Approx(scores[order]).epsilon(raw.epsilon));
+    }
+}
+TEST_CASE("Oddities", "[XBAODE]") {
+    auto clf = bayesnet::XBAODE();
+    auto raw = RawDatasets("iris", true);
+    auto bad_hyper = nlohmann::json{
+        {{"order", "duck"}},
+        {{"select_features", "duck"}},
+        {{"maxTolerance", 0}},
+        {{"maxTolerance", 7}},
+    };
+    for (const auto &hyper : bad_hyper.items()) {
+        INFO("XBAODE hyper: " << hyper.value().dump());
+        REQUIRE_THROWS_AS(clf.setHyperparameters(hyper.value()), std::invalid_argument);
+    }
+    REQUIRE_THROWS_AS(clf.setHyperparameters({{"maxTolerance", 0}}), std::invalid_argument);
+    auto bad_hyper_fit = nlohmann::json{
+        {{"select_features", "IWSS"}, {"threshold", -0.01}},
+        {{"select_features", "IWSS"}, {"threshold", 0.51}},
+        {{"select_features", "FCBF"}, {"threshold", 1e-8}},
+        {{"select_features", "FCBF"}, {"threshold", 1.01}},
+    };
+    for (const auto &hyper : bad_hyper_fit.items()) {
+        INFO("XBAODE hyper: " << hyper.value().dump());
+        clf.setHyperparameters(hyper.value());
+        REQUIRE_THROWS_AS(clf.fit(raw.Xv, raw.yv, raw.features, raw.className, raw.states, raw.smoothing),
+                          std::invalid_argument);
+    }
+    auto bad_hyper_fit2 = nlohmann::json{
+        {{"alpha_block", true}, {"block_update", true}},
+        {{"bisection", false}, {"block_update", true}},
+    };
+    for (const auto &hyper : bad_hyper_fit2.items()) {
+        INFO("XBAODE hyper: " << hyper.value().dump());
+        REQUIRE_THROWS_AS(clf.setHyperparameters(hyper.value()), std::invalid_argument);
+    }
+}
+TEST_CASE("Bisection Best", "[XBAODE]") {
+    auto clf = bayesnet::XBAODE();
+    auto raw = RawDatasets("kdd_JapaneseVowels", true, 1200, true, false);
+    clf.setHyperparameters({
+        {"bisection", true},
+        {"maxTolerance", 3},
+        {"convergence", true},
+        {"convergence_best", false},
+    });
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    REQUIRE(clf.getNumberOfNodes() == 210);
+    REQUIRE(clf.getNumberOfEdges() == 406);
+    REQUIRE(clf.getNotes().size() == 1);
+    REQUIRE(clf.getNotes().at(0) == "Number of models: 14");
+    auto score = clf.score(raw.X_test, raw.y_test);
+    auto scoret = clf.score(raw.X_test, raw.y_test);
+    REQUIRE(score == Catch::Approx(0.991666675f).epsilon(raw.epsilon));
+    REQUIRE(scoret == Catch::Approx(0.991666675f).epsilon(raw.epsilon));
+}
+TEST_CASE("Bisection Best vs Last", "[XBAODE]") {
+    auto raw = RawDatasets("kdd_JapaneseVowels", true, 1500, true, false);
+    auto clf = bayesnet::XBAODE();
+    auto hyperparameters = nlohmann::json{
+        {"bisection", true},
+        {"maxTolerance", 3},
+        {"convergence", true},
+        {"convergence_best", true},
+    };
+    clf.setHyperparameters(hyperparameters);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    auto score_best = clf.score(raw.X_test, raw.y_test);
+    REQUIRE(score_best == Catch::Approx(0.973333359f).epsilon(raw.epsilon));
+    // Now we will set the hyperparameter to use the last accuracy
+    hyperparameters["convergence_best"] = false;
+    clf.setHyperparameters(hyperparameters);
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    auto score_last = clf.score(raw.X_test, raw.y_test);
+    REQUIRE(score_last == Catch::Approx(0.976666689f).epsilon(raw.epsilon));
+}
+TEST_CASE("Block Update", "[XBAODE]") {
+    auto clf = bayesnet::XBAODE();
+    auto raw = RawDatasets("mfeat-factors", true, 500);
+    clf.setHyperparameters({
+        {"bisection", true},
+        {"block_update", true},
+        {"maxTolerance", 3},
+        {"convergence", true},
+    });
+    clf.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    REQUIRE(clf.getNumberOfNodes() == 1085);
+    REQUIRE(clf.getNumberOfEdges() == 2165);
+    REQUIRE(clf.getNotes().size() == 3);
+    REQUIRE(clf.getNotes()[0] == "Convergence threshold reached & 15 models eliminated");
+    REQUIRE(clf.getNotes()[1] == "Used features in train: 20 of 216");
+    REQUIRE(clf.getNotes()[2] == "Number of models: 5");
+    auto score = clf.score(raw.X_test, raw.y_test);
+    auto scoret = clf.score(raw.X_test, raw.y_test);
+    REQUIRE(score == Catch::Approx(1.0f).epsilon(raw.epsilon));
+    REQUIRE(scoret == Catch::Approx(1.0f).epsilon(raw.epsilon));
+    //
+    // std::cout << "Number of nodes " << clf.getNumberOfNodes() << std::endl;
+    // std::cout << "Number of edges " << clf.getNumberOfEdges() << std::endl;
+    // std::cout << "Notes size " << clf.getNotes().size() << std::endl;
+    // for (auto note : clf.getNotes()) {
+    //     std::cout << note << std::endl;
+    // }
+    // std::cout << "Score " << score << std::endl;
+}
+TEST_CASE("Alphablock", "[XBAODE]") {
+    auto clf_alpha = bayesnet::XBAODE();
+    auto clf_no_alpha = bayesnet::XBAODE();
+    auto raw = RawDatasets("diabetes", true);
+    clf_alpha.setHyperparameters({
+        {"alpha_block", true},
+    });
+    clf_alpha.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    clf_no_alpha.fit(raw.X_train, raw.y_train, raw.features, raw.className, raw.states, raw.smoothing);
+    auto score_alpha = clf_alpha.score(raw.X_test, raw.y_test);
+    auto score_no_alpha = clf_no_alpha.score(raw.X_test, raw.y_test);
+    REQUIRE(score_alpha == Catch::Approx(0.720779f).epsilon(raw.epsilon));
+    REQUIRE(score_no_alpha == Catch::Approx(0.733766f).epsilon(raw.epsilon));
+}