bayesclass/bayesclass/tests/test_TANNew.py

import pytest
import numpy as np
from matplotlib.testing.decorators import image_comparison
from matplotlib.testing.conftest import mpl_test_settings


from bayesclass.clfs import TANNew
from .._version import __version__


@pytest.fixture
def clf():
    return TANNew(random_state=17)


def test_TANNew_default_hyperparameters(data, clf):
    # Test default values of hyperparameters
    assert not clf.show_progress
    assert clf.random_state == 17
    clf = TANNew(show_progress=True)
    assert clf.show_progress
    assert clf.random_state is None
    clf.fit(*data)
    assert clf.head_ == 0
    assert clf.class_name_ == "class"
    assert clf.feature_names_in_ == [
        "feature_0",
        "feature_1",
        "feature_2",
        "feature_3",
    ]


def test_TANNew_version(clf):
    """Check TANNew version."""
    assert __version__ == clf.version()


def test_TANNew_nodes_edges(clf, data):
    assert clf.nodes_edges() == (0, 0)
    clf.fit(*data, head="random")
    assert clf.nodes_leaves() == (5, 7)


def test_TANNew_states(clf, data):
    assert clf.states_ == 0
    clf.fit(*data)
    assert clf.states_ == 18
    assert clf.depth_ == clf.states_


def test_TANNew_random_head(clf, data):
    clf.fit(*data, head="random")
    assert clf.head_ == 3


def test_TANNew_local_discretization(clf, data):
    expected = [-1, [0, -1], [0, -1], [1, -1]]
    clf.fit(*data)
    for feature in range(4):
        assert (
            expected[feature] == clf.estimator_.discretizer_.target_[feature]
        )


def test_TANNew_classifier(data, clf):
    clf.fit(*data)
    attribs = [
        "classes_",
        "X_",
        "y_",
        "head_",
        "feature_names_in_",
        "class_name_",
    ]
    for attr in attribs:
        assert hasattr(clf, attr)
    X = data[0]
    y = data[1]
    y_pred = clf.predict(X)
    assert y_pred.shape == (X.shape[0],)
    assert sum(y == y_pred) == 146


@image_comparison(
    baseline_images=["line_dashes_TANNew"],
    remove_text=True,
    extensions=["png"],
)
def test_TANNew_plot(data, features, clf):
    # mpl_test_settings will automatically clean these internal side effects
    mpl_test_settings
    clf.fit(*data, features=features, head=0)
    clf.plot("TANNew Iris head=0")


def test_TANNew_wrong_num_features(data, clf):
    with pytest.raises(
        ValueError,
        match="Number of features does not match the number of columns in X",
    ):
        clf.fit(*data, features=["feature_1", "feature_2"])


def test_TANNew_wrong_hyperparam(data, clf):
    with pytest.raises(ValueError, match="Unexpected argument: wrong_param"):
        clf.fit(*data, wrong_param="wrong_param")


def test_TANNew_head_out_of_range(data, clf):
    with pytest.raises(ValueError, match="Head index out of range"):
        clf.fit(*data, head=4)


def test_TANNew_error_size_predict(data, clf):
    X, y = data
    clf.fit(X, y)
    with pytest.raises(ValueError):
        X_diff_size = np.ones((10, X.shape[1] + 1))
        clf.predict(X_diff_size)